PEARSON 


UNIX 
环境 高 级 编 各 


第 3 版 ) 






[ 美 ] W. Richard Stevens a 
Stephen A. Rago 
RFS KW ET i 





g 人 民 邮 电 出 版 社 


POSTS & TELECOM PRESS 





uompa parat. 了 





UNIX 
境 高 级 编程 


(第 3 版 ) 







W. Richard Stevens 
[tl "Stephen A. Rago. T 
RES KTR AGT 译 


人 民 邮 电 出 版 社 
北京 


图 书 在 版 编目 《C TP) 数据 


ESR: ME / OD SSC 
Gtovens, W.R.) , GO. WR (ayo, S.A.) Hs MEIG, 
RER x 2 版 .一 北京 : 人民 朗 电 出 版 社 ， 

nu. 

书 名 原文 : Advanced programing in the UNIX 
environment, third edition 

ISBN 978-7-115-35211-8 


1. Qu II. Dik Oie ORe Oke O 
M. COUNDOSHE RAE — EFi IV. OTP316.81 


中 国 版 本 图 书馆 CIP 数 据 核 字 (2014) 80810784 






肉 容 提要 


本 书 是 被 上 为 UNIX RE “KHE” (8 Advanced Programming in the UNIX Environment 一 书 的 第 3 版。 在 本 书 
第 2 版 出 版 后 的 8 年 中 ，UNIX 发 生 了 巨大 的 变化 ,特别 是 影响 UNIX 编 各 接口 的 有 关 标准 变化 根 大 . 本 书 在 保 
持 削 一 版 风格 的 基 夏 上 , AWAREI AAE A BEET T AT ANAA, 反映 了 景 新 的 技术 发 展 . 书 中 除了 介绍 UNIX 
文件 和 目 孙 、 标 准 VO 库 、 系 统 数据 文件 和 信息 、 进 程 环境 ， 进 程控 制 、 进 程 关系 、 信 号 、 线 程 、 线 程控 制 、 守 
护 进程 、 各 种 WO、 进 程 间 通信 、 网 络 PC、 伪 终端 等 方 而 的 内 容 ， 还 在 此 基础 上 介绍 了 众 元 应 用 实例 ， 包 括 如 
何 创建 数据 库 甬 数 序 以 及 如 何 与 网 络 打印 机 通信 等 。 此 外 ， 和 还 在 附录 中 给 出 了 十 数 原型 和 部 分 习 是 的 答案 - 

本 书 内 容 权威 ， 概 多 清晰 ， 闪 述 精 妨 ， 对 于 所 有 层次 UNDULinux 程序 员 帮 是 一 本 不 可 或 后 的 参考 书 - 
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作为 UNIX 环境 编程 方面 的 经 典 著作 ， 由 著名 技术 专家 W. Richard Stevens 撰写 的 Advanced 
Programming in the UNIX® Environment 自 1992 年 出 版 以 来 ， 受 到 专家 和 读者 的 普遍 欢迎 。 由 
Stephen A. Rago 作为 共同 作者 ， 根 据 新 的 系统 和 规范 进行 了 更 新 ，2005 年 出 版 了 第 2 版 。2013 
年 由 Rago 更 新 到 了 第 3 版 ,涵盖 了 70 多 个 最 新 版 POSIX.1 标准 的 新 增 接口 ， 删 除了 STREAMS 
相关 接口 的 内 容 ， 并 将 使 用 的 典型 平台 更 新 为 Solaris 10、Darwin 10.8.0, FressBSD 8.0 和 Ubuntu 
12.04。 

目前 UNIX 版 本 不 断 涌现 ， 例 如 广 为 使 用 的 苹果 Mac OS X 和 iOS 使 用 开源 类 UNIX 操作 系 
统 Darwin， 谷 歌 的 Android 采用 Linux 作为 操作 系统 内 核 。 尽管 UNIX 编程 环境 和 C 程序 设计 语 
言 的 标准 化 方面 已 经 有 不 少 工作 ， 但 系统 接口 不 断 增 加 ， 例 如 Single UNIX Specification 第 1 版 
(SUSv1) 1994 年 出 版 时 大 约 包 含 了 1170 个 接口 (也 被 称 为 Spec 1170), 到 2010 年 发 布 第 4 版 时 
(SUSv4)， 已 经 包括 1833 个 接口 。 虽 然 系统 调用 接口 和 库 函 数 可 参见 《UNIX 程序 员 手 册 》 第 2、 
3 部 分 ， 但 “手册 中 没有 给 出 实例 及 基本 原理 ， 而 这 些 正 是 本 书 所 要 讲述 的 内 容 ”( 第 1 版 前 言 )。 
本 书 精 选 了 常用 的 400 多 个 系统 调用 和 库 函 数 ， 这 些 接口 基本 是 UNIX 系统 软件 的 核心 功能 ， 涵 
iif UNIX/Linux 系统 编程 的 方方面面 。 本 书 通过 简明 完整 的 例子 来 说 明 其 用 途 ， 不 仅仅 说 明了 
其 基本 用 法 ， 还 反映 了 不 同 平台 之 间 细 微 差 异 ， 有 助 于 读者 对 整个 编程 环境 有 全 面 深入 的 了 解 。 
在 翻译 本 书 的 过 程 中 ， 译 者 也 是 收益 良 多 ， 同 时 ， 一 些 经 典 的 案例 已 经 用 于 大 学 课堂 教学 和 编程 
实践 中 。 

本 书 的 第 2 章 至 第 12 章 由 同济 大 学 张 亚 英 翻译 和 校对 ， 其 余 由 上 海 交 通 大 学 软件 学 院 威 正 
伟 翻 译 和 校对 ， 上 海 交 通 大 学 计算 机 系 尤 晋 元 教授 对 全 书 统 稿 。 本 书 第 1 版 和 第 2 版 中 译本 自 出 
版 以 来 ， 很 多 读者 对 其 提出 了 宝贵 意见 ， 在 本 版 本 中 尽量 采纳 了 这 些 意见 。 同 时 ， 我 们 的 工作 还 
得 到 上 海 交 通 大 学 软件 学 院 许多 研究 生 〈 葛 馨 填 、 王 佳 骏 、 李 栖 、 王 润泽 、 朱 新 宇 、 孙 海洋 、 
Jed. WRR BE., RAD 的 帮助 ， 在 此 一 并 表示 感谢 。 

还 要 特别 感谢 人 民 邮 电 出 版 社 编辑 杨 海 玲 在 本 书 的 编辑 、 出 版 方面 所 付出 的 辛勤 劳动 。 

我 们 希望 本 书 的 出 版 对 相关 科技 人 员 和 读者 所 有 帮助 ， 同 时 也 期 望 广大 专家 和 读者 提出 宝贵 
意见 。 


第 2 版 序 


我 差不多 每 次 在 接受 专访 当中 , 或 是 做 技术 讲座 后 的 提问 时 间 里 , 总 会 被 问 及 这 样 一 个 问题 : 
“你 想到 过 UNIX 会 生存 这 么 长 时 间 吗 ? ”自然 ， 每 次 的 回答 都 是 : “没有 ， 我 们 没 想到 会 是 这 
样 。” 从 某 种 角度 说 ，UNIX 系统 已 经 伴随 了 商用 计算 行业 历史 的 大 半 ， 而 这 也 早 就 不 是 什么 新 
闻 了 。 

发 展 的 历程 错综复杂 ， 充 满 变数 。 自 20 世纪 70 年 代 初 以 来 ， 计 算 机 技术 经 历 了 沧海 桑田 般 
的 变化 , 尤其 体现 在 网 络 技术 的 普遍 应 用 、 图 形 化 的 无 所 不 在 、 个 人 计算 的 触手 可 及 , 然而 UNIX 
系统 却 奇 迹 般 地 容纳 和 适应 了 所 有 这 些 变化 。 虽 然 商 业 应 用 环境 在 桌面 领域 目前 仍然 为 微软 和 英 
特 尔 两 家 公司 所 统治 ， 但 是 在 某 些 方面 已 经 从 单一 供应 商 向 多 种 来 源 转变 ， 特 别 是 近年 来 对 公共 
标准 和 免费 可 用 来 源 的 信赖 与 日 俱 增 。 

UNIX 作为 一 种 现象 而 不 单 是 商标 品牌 ， 有 幸 能 与 时 俱 进 ， 乃 至 领导 潮流 。 在 20 世纪 70~ 
80 年 代 ，AT&T 虽 对 UNIX 的 实际 源 代码 进行 了 版 权 保 护 ， 但 却 鼓励 在 系统 的 接口 和 语言 基础 上 
进行 标准 化 的 工作 。 例如 , AT&T 发 布 了 SVID (System V Interface Definition, 系统 V 接口 定义 )， 
这 成 为 POSIX 及 其 后 续 工作 的 基础 。 后 来 ，UNIX 可 以 说 相当 优雅 地 适应 了 网 络 环境 ， 虽 不 那么 
轻巧 却 也 充分 地 适应 了 图 形 环境 。 再 往 后 ， 开 源 运动 的 技术 基础 中 集成 了 UNIX 的 基本 内 核 接口 
和 许多 它 独特 的 用 户 级 工具 。 

即使 在 UNIX 软件 系统 本 身 还 是 专 有 的 时 候 ， 鼓 励 出 版 UNIX 系统 方面 的 论文 和 书籍 也 是 至 
关 重 要 的 ， 著 名 的 例子 就 是 Maurice Bach 的 《UNIX 操作 系统 设计 》 一 书 。 其 实 我 要 说 明 的 是 ， 
UNIX 长 寿 的 主要 原因 是 , 它 吸引 了 极 具 天 分 的 技术 作者 , 为 大 众 解读 它 的 优美 和 神秘 所 在 。 Brian 
Kernighan 是 其 中 之 一 ，Rich Stevens 自然 也 是 。 本 书 第 1 版 连同 Stevens 所 著 的 系列 网 络 技术 书 
籍 ， 被 公认 为 优秀 的 、 匠 心 独 具 的 名 著 ， 成 为 极其 畅销 的 作品 。 

然而 , 本 书 第 1 版 毕竟 出 版 时 间 太 早 了 , 那 时 还 没有 出 现 Linux, 源 自 伯 克利 CSRG 的 UNIX 
接口 的 开源 版 本 还 没有 广 为 流 行 ， 很 多 人 的 网 络 还 在 用 串 行 调制 解 调 器 。Steve Rago 认真 仔细 地 
更 新 了 本 书 ， 以 反映 所 有 这 些 技术 进展 ， 同 时 还 考虑 到 各 种 ISO 标准 和 IEEE 标准 这 些 年 来 的 变 
化 。 因 此 ， 他 的 例子 是 最 新 的 ， 也 是 最 新 测试 过 的 。 

总 之 ， 这 是 一 本 弥 足 珍贵 的 经 典 著 作 的 更 新 版 。 





Dennis Ritchie 
2005 年 3 月 于 新 泽 西 州 默 里 山 市 
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引言 


从 我 第 一 次 修订 《UNIX 环境 高 级 编程 》 一 书 以 来 已 经 快 有 8 年 了 ， 期 间 发 生 了 很 多 的 变化 。 

。 在 出 版 第 2 版 之 前 ，Open Group 完成 了 2004 版 的 Single UNIX Specification， 它 涵盖 了 两 
套 勘 误 表 的 修改 。2008 年 ，Open Group 完成 了 新 版 的 Single UNIX Specification， 它 更 新 
了 基本 定义 ， 添 加 了 新 的 接口 ， 并 且 去 除了 弃 用 的 接口 。 这 套 规范 被 称 为 2008 年 版 的 
POSIX.1， 其 中 包含 第 7 版 的 基本 规范 ,并 在 2009 年 发 行 。 2010 年 ， 它 与 更 新 后 的 curses 
接口 捆绑 ， 一 起 作为 Single UNIX Specification 第 4 版 (SUSv4) 进行 再 版 。 

。 运行 在 Intel 处 理 器 上 的 Mac OS X 操作 系统 的 10.5. 10.6 和 10.8 版 , 被 Open Group 认证 
为 UNIX 系统 。 

。 苹果 公司 停止 了 PowerPC 平台 上 Mac OS X 的 开发 。 在 10.6 发 行 版 (Snow Leopard) 之 
后 只 针对 x86 平台 发 布 了 新 的 操作 系统 版 本 。 

e Solaris 操作 系统 以 开源 的 形式 发 布 ， 试 图 与 FreeBSD、Linux 和 Mac OS X 遵循 的 开源 模 
式 在 声望 上 一 争 高 下 。 在 2010 年 ，Oracle 收购 了 Sun Microsystems 之 后 ，OpenSolaris 的 
开发 被 终止 。 作 为 替代 ，Solaris 社区 组 建 了 Illumos 项 目 来 继续 基于 OpenSolaris 的 开源 
开发 。 更 多 详细 的 信息 可 以 从 http:/www.illumos.org 获得 。 

。 2011 4E, C 语言 标准 被 更 新 , 但 是 因为 系统 并 未 能 跟 上 其 变化 , 本 书 中 依然 参照 1999 版 。 

最 重要 的 是 ， 在 第 2 版 中 使 用 的 平台 已 经 过 时 了 。 本 书 这 一 版 中 涉及 以 下 平台 。 

(1) FreeBSD 8.0， 前 身 是 加 州 大 学 伯克利 分 校 计算 机 系统 研究 组 发 布 的 4.4BSD 系统 ， 运 行 
在 32 位 Intel Pentium 处 理 器 上 。 

(2) Linux 3.2.0 (Ubuntu 12.04 发 布 版 ) ， 这 是 一 个 免费 的 类 UNIX 操作 系统 ， 运 行 在 64 位 
的 Intel Core i5 处 理 器 上 。 

(3) Apple Mac OS X 10.6.8 ff (Darwin 10.8.0) ， 运 行 在 64 位 Intel Core2 Duo 处 理 器 上 (Darwin 
基于 FreeBSD 和 Mach)。 我 选择 从 PowerPC 平台 转向 Intel 平台 ， 是 因为 最 新 版 的 Mac OS X 不 
再 支持 PowerPC 平台 。 这 次 选择 带 来 的 缺点 是 涉及 的 处 理 器 倾斜 向 了 Intel, 而 当 讨 论 到 异 构 性 问 
题 时 ， 涉 及 的 处 理 器 如 果 能 在 字 节 序 和 整数 大 小 等 方面 有 不 同 的 性 质 将 是 很 有 好 处 的 。 

(4) Solaris 10, Sun Microsystems (现在 的 Oracle) 的 System V Release 4 的 派生 系统 ， 运 行 
在 64 位 UltraSPARC IIi 处 理 器 上 。 


与 第 2 版 的 不 同 


最 大 的 变化 之 一 是 POSIX.1-2008 中 的 Single UNIX Specification 弃 用 了 一 些 STREAMS 相关 
接口 。 这 是 准备 在 该 标准 的 未 来 版 本 中 去 掉 全 部 这 些 接口 过 程 的 第 一 步 。 因 此 ， 我 已 经 不 情愿 地 
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在 这 一 版 中 删除 了 STREAMS 的 内 容 。 这 是 一 个 不 幸 的 变化 ， 因 为 STREAMS 接口 为 socket 接口 
提供 了 一 个 很 好 的 对 照 ， 并 且 在 很 多 方面 更 为 灵活 。 不 可 否认 ， 当 谈论 到 STREAMS 时 我 并 非 绝 
对 公正 ， 但 是 毫 无 疑问 的 是 ， 在 现 有 系统 中 它 的 分 量 已 经 减轻 。 

。 Linux 基础 系统 中 未 包含 STREAMS， 虽 然 添加 该 功能 的 包 (LiS 和 OpenSS7) 是 可 用 的 。 

e 虽然 Solaris 10 中 包含 了 STREAMS, fH Solaris 11 的 socket 实现 并 没有 构建 在 STREAMS 

ZE 

。 MacOS X 不 包含 STREAMS x fi. 

e FreeBSD FAE STREAMS 支持 (也 从 未 包含 过 )。 

随 着 STREAMS 相关 内 容 的 去 除 ， 新 的 主题 变 得 有 机 会 替代 它 ， 例 如 POSIX 异步 VO. 

在 本 书 第 2 版 中 ，Linux 版 本 是 基于 2.4 版 的 。 在 这 次 的 版 本 中 ， 我 们 已 经 更 新 到 了 3.2 版 。 
两 个 版 本 的 最 大 不 同 之 一 是 线程 系统 。 在 Linux 2.4 和 Linux 2.6 之 间 ， 线 程 的 实现 变 为 Native 
POSIX Thread Library (NPTL). NPTL 使 得 Linux 线程 的 行为 与 其 他 系统 的 线程 更 加 相似 。 

总 的 来 说 , 这 次 的 版 本 涵盖 了 超过 70 个 新 的 接口 , 包括 处 理 异 步 UO、 自 旋 锁 、 屏 障 和 POSIX 
信和 号 量 等 接口 。 除 了 一 些 普遍 使 用 的 接口 被 保留 ， 大 多 数 弃 用 的 接口 均 被 删除 。 
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Romny French, John Fuller, Jessica Goldstein, Julie Nahil 和 Debra Williams-Cauley， 此 外 ， 感 谢 
Jill Hobbs 在 这 段 时 间 提供 了 她 的 专业 审 稿 能 力 。 

最 后 ， 感 谢 我 的 家 人 对 我 在 这 次 再 版 上 花费 了 如 此 多 时 间 给 予 的 理解 。 

和 以 前 一 样 ， 书 中 实例 的 源码 可 以 从 www.apuebook.com 上 获得 , 我 非常 欢迎 读者 发 来 邮件 ， 
发 表 评论 ， 提 出 建议 ， 订 正 错误 。 


Stephen A. Rago 
sar@apuebook.com 


2013 年 1 月 于 新 泽 西 州 沃 伦 市 
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我 与 Rich Stevens 最 早 是 通过 电子 邮件 开始 交往 的 ， 当 时 我 发 邮件 报告 他 的 第 一 本 书 《UNIX 
网 络 编程 》 的 一 个 排版 错误 。 他 回信 开玩笑 说 我 是 第 一 个 给 他 发 这 本 书 勘误 的 人 。 到 他 1999 年 
故去 之 前 ， 我 们 会 时 不 时 地 通 一 些 邮件 ,一般 都 是 在 有 了 问题 认为 对 方 能 解答 的 时 候 。 我 们 在 
USENIX 会 议 期 间 多 次 相 见 ， 并 共 进 晚餐 ，Rich 在 会 议 中 给 大 家 做 技术 培训 。 
Rich Stevens 真是 个 益友 ,行为 举止 很 有 绅士 风度 。 我 在 1993 年 写 《UNIX RA V 网 络 编程 》 
时 ， 试 图 把 书写 成 他 的 《UNIX 网 络 编程 》 的 系统 V 版 。Rich 高 兴 地 为 我 审阅 了 好 几 章 ， 并 不 把 
我 当成 竞争 对 手 ， 而 是 当 作 一 起 写 书 的 同事 。 我 们 曾 多 次 谈 到 要 合作 给 他 的 《TCP/IP 详解 》 写 个 
STREAMS 版 。 天 若 有 情 , 我 们 或 许 已 经 完成 了 这 个 心愿 。 然而 , Rich 已 经 驾 稚 西 去 ,修订 《UNIX 
环境 高 级 编程 》 就 成 为 我 跟 他 一 起 写 书 的 最 易 实 现 的 方式 。 
当 Addison-Wesley 公司 的 编辑 找到 我 说 想 修订 Rich 的 这 本 书 时 ， 我 第 一 反应 是 这 本 书 没 有 
多 少 要 改 的 。 尽 管 13 年 过 去 了 ，Rich 的 书 还 是 疯 然 屹立 。 但 是 ， 与 当初 本 书 出 版 的 时 候 相 比 ， 
今日 的 UNIX 行业 已 经 有 了 巨大 的 变化 。 
© 系统 V 的 各 个 变种 渐渐 被 Linux 所 取代 。 原 来 生产 硬件 配 以 各 自 的 UNIX 版 本 的 几 个 主 
要 厂商 ， 要 么 提供 了 Linux 的 移植 版 本 ， 要 么 宣布 支持 Linux. Solaris 可 能 算是 硕果 仅 存 
的 占有 一 定 市 场 份 额 的 UNIX 系统 V 版 本 4 BST. 
。 加 州 大 学 伯克利 分 校 的 CSRG (计算机 科学 研究 组 ) 在 发 布 了 4.4BSD 之 后 ， 已 经 决定 不 
再 开发 UNIX 操作 系统 ， 只 有 几 个 志愿 者 小 组 还 维护 着 一 些 可 公开 获得 的 版 本 。 
e Linux 得 到 数 以 千 计 的 志愿 者 的 支持 , 它 的 引入 使 任何 一 个 拥有 计算 机 的 人 都 能 运行 类 似 
于 UNIX 系统 的 操作 系统 ， 并 且 可 以 免费 获得 源 代码 支持 哪怕 最 新 的 硬件 设备 。 在 已 经 
存在 儿 种 免费 BSD 版 本 的 情况 下 ，Linux 的 成 功 确实 是 个 奇迹 。 
。 苹果 公司 作为 一 个 富有 创新 精神 的 公司 ， 己 经 放弃 了 老 的 Mac 操作 系统 ， 取 而 代 之 的 是 
-个 在 Mach 和 FreeBSD 基础 上 开发 的 新 系统 。 
因此 ， 我 已 经 努力 更 新 本 书 中 的 内 容 ， 以 反映 这 4 种 平台 。 
在 Rich 1992 年 出 版 了 《UNIX 环境 高 级 编程 》 之 后 , 我 扔 掉 了 手头 几乎 所 有 的 UNIX 程序 员 
手册 。 这 些 年 来 ， 我 桌 上 最 常 摆 放 的 就 是 两 本 书 ， 一 本 是 字典 ， 另 一 本 就 是 《UNIX 环境 高 级 编 
程 》。 我 希望 读者 也 能 认为 本 修订 版 一 样 有 用 。 


对 第 1 版 的 改动 


Rich 的 书 依然 屹立 ， 我 试图 不 去 改动 他 这 本 书 原来 的 风格 。 但 是 13 年 间 世 事 兴 衰 ， 尤 其 是 
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影响 UNIX 编程 接口 的 有 关 标 准 变化 很 大 。 

我 依据 标准 化 组 织 的 标准 ， 更 新 了 全 书 相关 的 接口 方面 的 内 容 。 第 2 章 改动 较 大 ， 因 为 它 主 
要 是 讨论 标准 的 。 本 书 第 1 版 是 根据 POSIX.1 标准 的 1990 年 版 写 的 ， 本 修订 版 依据 2001 年 版 的 
新 标准 ， 内 容 要 丰富 很 多 。1990 年 ISO 的 C 标准 在 1999 年 也 更 新 了 ， 有 些 改动 影响 到 POSIX.1 
标准 中 的 接口 。 

目前 的 POSIX.1 规范 涵盖 了 更 多 的 接口 。Open Group (Uff X/Open) 发 布 的 “Single UNIX 
Specification” 的 基本 规范 现在 已 经 并 入 POSIX.1， 后 者 包含 了 几 个 1003.1 标准 和 另外 几 个 标准 草 
案 ， 原 来 这 些 标准 是 分 开 出 版 的 。 

我 也 相应 地 增加 了 些 章节 ， 讨 论 新 主题 。 线 程 和 多 线程 编程 是 相当 重要 的 概念 ， 因 为 它们 为 
程序 员 处 理 并 发 和 异步 提供 了 更 清楚 的 方式 。 

套 接 字 接口 现在 也 是 POSIX.1 的 一 部 分 了 。 它 为 进程 间 通 信 CPC) 提供 了 单一 的 接口 ， 而 
不 考虑 进程 的 位 置 。 它 成 为 IPC 章节 的 自然 扩展 。 

我 省 略 了 POSIX.1 中 的 大 部 分 实时 接口 。 这 些 内 容 最 好 是 在 一 本 专门 讲述 实时 编程 的 书 中 介 
绍 。 参 考 文献 里 有 一 本 这 方面 的 书 。 

我 把 最 后 面 几 章 的 案例 研究 也 更 新 了 ， 用 了 更 接近 现实 的 例子 。 例 如 ， 现 在 很 少 有 系统 通过 
串口 或 并 口 连接 PostScript 打印 机 了 ， 多 数 PostScript 打印 机 是 通过 网 络 连 接 的 ， 所 以 我 对 
PostScript 打印 机 通信 的 例子 做 了 修改 。 

有 关 调 制 解 调 器 通信 的 那 一 章 如 今 已 经 不 太 适 用 了 。 原 始 材料 我 们 保留 在 本 书 网 站 上 ， 有 两 
种 格式 : PostScript Chttp//www.apuebook.com/lostchapter/modem.ps) 和 PDF (http://www. apuebook.com/ 
lostchapter/modem.pdf) . 

书 中 实例 的 源 代 码 也 可 以 从 www.apuebook.com 上 获得 。 多 数 实例 已 经 在 下 述 4 种 平台 上 运 
行 过 了 。 

(1) FreeBSD 5.2.1， 是 加 州 大 学 伯克利 分 校 CSRG 的 4.4BSD 的 一 个 变种 ， 在 英特尔 奔腾 处 
理 器 上 运行 。 

(2) Linux 2.4.22 (Mandrake 9.2 发 布 ) ， 是 一 个 免费 的 类 UNIX 操作 系统 ， 运 行 于 英特尔 奔 
腾 处 理 器 上 。 

(3) Solaris 9， 是 Sun 公司 系统 V 版 本 4 的 变种 ， 运 行 于 64 位 的 UltraSPARC Ili 处 理 器 上 。 

(4) Darwin 7.4.0， 是 基于 FreeBSD 和 Mach 的 操作 系统 环境 ， 也 是 Apple Mac OS X 10.3 版 
本 的 核心 ， 运 行 于 PowerPC 处 理 器 上 。 


致谢 


首先 要 感谢 Rich Stevens 独立 创作 了 本 书 第 1 版 ， 它 立即 成 为 一 本 经 典 著作 。 

没有 家 人 的 支持 ， 我 不 可 能 修订 此 书 。 他 们 容忍 我 满 屋子 散落 稿 纸 〈 比 平常 更 其 ) ， 霸 占 了 
家 里 的 好 几 台 机 器 ,成 天 埋头 于 电脑 屏幕 前 。 我 的 妻子 Jeane 甚至 亲自 动手 帮 有 我 在 一 台 测 试 的 机 
器 上 安装 了 Linux。 

多 名 技术 审 校 者 提出 了 很 多 改进 意见 ， 以 确保 内 容 准确 。 我 非常 感谢 David Bausum, David 
Boreham, Keith Bostic. Mark Ellis. Phil Howard, Andrew Josey, Mukesh Kacker、Brian Kernighan, 
Bengt Kleberg, Ben Kuperman, Eric Raymond 和 Andy Rudoff. 

我 还 要 谢谢 Andy Rudoff 给 我 解答 有 关 Solaris 的 问题 ， 谢 谢 Dennis Ritchie 不 惜 花 时 间 从 故 
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纸 堆 中 为 我 寻找 有 关 历 史 方 面 问题 的 答案 。 再 次 谢谢 Addison-Wesley 公司 的 员工 , 与 他 们 合作 令 
人 愉快 ， 谢 谢 Tyrrell Albaugh、Mary Franz. John Fuller. Karen Gettman. Jessica Goldstein. Noreen 
Regina 和 John Wait。 特 别 感 谢 Evelyn Pyle 细致 地 编辑 了 本 书 。 

就 像 Rich 曾经 做 到 的 那样 ， 我 非常 欢迎 读者 发 来 邮件 ， 发 表 评 论 ， 提 出 建议 ， 订 正 错误 。 


Stephen A. Rago 
sar@apuebook.com 


2005 Œ 4 月 于 新 泽 西 州 沃 伦 市 
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引言 


本 书 描述 了 UNIX 系统 的 程序 设计 接口 一 一 系统 调用 接口 和 标准 C 库 提供 的 很 多 函数 。 本 书 
针对 的 是 所 有 的 程序 员 。 

与 大 多 数 操作 系统 一 样 ，UNIX 为 程序 运行 提供 了 大 量 的 服务 一 一 打开 文件 、 读 文件 、 启 动 
一 个 新 程序 、 分 配 存 储 区 以 及 获得 当前 时 间 等 。 这 些 服务 被 称 为 系统 调用 接口 (system call 
interface)。 另 外 ， 标 准 C 库 提供 了 大 量 广泛 用 于 C 程序 中 的 函数 (格式 化 输出 变量 的 值 、 比 较 两 
个 字符 串 等 )。 

系统 调用 接口 和 库 函 数 可 参见 《UNIX 程序 员 手 册 》 第 2、3 部 分 。 本 书 不 是 这 些 内 容 的 重复 。 
手册 中 没有 给 出 实例 及 基本 原理 ， 而 这 些 则 正 是 本 书 所 要 讲述 的 内 容 。 


UNIX 标准 


20 世纪 80 年 代 出 现 了 各 种 版 本 的 UNIX, 20 世纪 80 年 代 后 期 ， 人 们 在 此 基础 上 制定 了 数 个 
国际 标准 ， 包 括 C 程序 设计 语言 的 ANSI 标准 、IEEE POSIX 标准 系列 〈 还 在 制定 中 )、X/Open 
可 移植 性 指南 。 l 

本 书 也 介绍 了 这 些 标准 ， 但 是 并 不 只 是 说 明 标准 本 身 ， 而 是 着 重 说 明 它 们 与 应 用 广泛 的 一 些 
实现 (主要 指 SVR4 以 及 即将 发 布 的 4.4BSD) 之 间 的 关系 。 这 是 一 种 贴近 现实 世界 的 描述 ， 而 这 
正 是 标准 本 身 以 及 仅 描述 标准 的 文献 所 缺少 的 。 


本 书 的 组 织 


本 书 分 为 以 下 6 个 部 分 。 

CD 对 UNIX 程序 设计 基本 概念 和 术语 的 简要 描述 (第 1 章 )， 以 及 对 各 种 UNIX 标准 化 工 
作 和 不 同 UNIX 实现 的 讨论 (第 2 章 )。 

(2) IO 一 一 不 带 缓存 的 VO (第 3 章 )、 文 件 和 目录 (第 4 章 )、 标 准 IO FE CHR $ 章 ) 和 标 
准 系统 数据 文件 〈 第 6 章 )。 

(3) 进程 一 一 UNIX 进程 的 环境 (第 7 章 )、 进 程控 制 (第 8 章 )、 进 程 之 间 的 关系 (第 9 章 ) 
和 信号 (第 10 章 )。 

(4) 更 多 的 IO 一 一 终端 IO (第 11 章 )、 高 级 UO (第 12 章 ) 和 守护 进程 (第 13 章 )。 

(5) IPC 一 一 进程 间 通 信 (第 14 EMR 15 章 )。 

(6) 实例 一 一 一 个 数据 库 的 函数 库 (第 16 章 )、 与 PostScript 打印 机 的 通信 (第 17 章 )、 调 
制 解 调 器 拨号 程序 (第 18 章 ) 和 使 用 伪 终 端 (第 19 38). 
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如 果 对 C 语言 较 熟 悉 并 具有 某 些 应 用 UNIX 的 经 验 ， 对 学 习 本 书 将 非常 有 益 ， 但 是 并 不 要 求 
读者 必须 具有 UNIX 编程 经 验 。 本 书面 向 的 读者 主要 是 : 熟悉 UNIX 的 程序 员 ， 以 及 熟悉 其 他 某 
个 操作 系统 且 希 望 了 解 大 多 数 UNIX 系统 提供 的 各 种 服务 细节 的 程序 员 。 


本 书 中 的 实例 


本 书包 含 了 大 量 实例 一 一 大 约 10 000 行 源 代码 。 所 有 实例 都 用 ANSIC 语言 编写 。 在 阅读 本 
书 时 ， 建 议 准备 一 本 你 所 使 用 的 UNIX 系统 的 《UNIX 程序 员 手 册 》， 在 细节 方面 有 时 需要 参考 该 
手册 。 

几乎 对 于 每 一 个 函数 和 系统 调用 ， 本 书 都 用 一 个 小 的 完整 的 程序 进行 了 演示 。 这 可 以 让 读者 
清楚 地 了 解 它们 的 用 法 ， 包 括 参数 和 返回 值 等 。 有 些小 程序 还 不 足以 说 明 库 函数 和 系统 调用 的 复 
杂 功 能 和 应 用 技巧 ， 所 以 书 中 还 包含 了 一 些 较 大 的 实例 〈 见 第 16 章 至 第 19 章 )。 

所 有 实例 的 源 代码 文件 都 可 在 因特网 上 用 匿名 ftp 从 因特网 主机 ftp.uu.net 的 published/ 
books/stevens. advprog.tar.Z 文件 下 载 。 读 者 可 以 在 自己 的 机 器 上 修改 并 运行 这 些 源 代码 。 


用 于 测试 实例 的 系统 


遗憾 的 是 ， 所 有 的 操作 系统 都 在 不 断 变 更 ，UNIX 也 不 例外 。 下 图 给 出 了 系统 V 和 4.xBSD 





4.3+BSD 
4.3BSD 4.3BSD Tahoe 4.3BSD Reno 4.4BSD ? 
BSD Net 1 | BSD Net 2 | 
ee ee E 
——1986 + 1987 1988 1989 à 1990 i 1991 1992 
4 1 [j 1 
SVR3.0 SVR3.1 SVR32 | | — SVR4 | 
XPG3 ANSI C POSIX.1 


4.xBSD 是 由 加 州 大 学 伯克利 分 校 CSRG 开发 的 。 该 小 组 还 发 布 了 BSD Netl 和 BSD Net 版 ， 
其 公开 的 源 代码 源 自 4.xBSD 系统 。SVRx 表示 ATAT 的 系统 V BH x MK. XPG3 指 X/Open 可 移植 
性 指南 的 第 3 个 发 行 版 。ANSIC 是 C 语言 的 ANSI 标 准 。POSIX.1 Æ IEEE il ISO 的 类 UNIX 系 
统 接口 标准 。2.2 节 和 2.3 节 将 对 这 些 标准 和 不 同 版 本 之 间 的 差别 做 更 多 的 说 明 。 
本 书 中 用 4.3+BSD 表示 源 自 伯克利 的 介 于 BSD Net2 和 4.4BSD 之 间 的 UNIX 系统 。 
在 本 书写 作 时 ，4.4BSD 尚未 发 布 ， 所 以 还 不 能 称 之 为 4.4BSD。 为 了 用 一 个 简单 的 名 字 来 引 
用 该 系统 ， 故 使 用 4.3+BSD。 
本 书 中 的 大 多 数 实 例 曾 在 下 面 4 种 UNIX 系统 上 运行 过 。 
(D U.H 公司 (UHC) 的 UNIX 系统 V/386 R4.0.2 (vanilla SVR4)， 运 行 于 Intel 80386 处 理 
28 [5s 
(2) 加 州 大 学 伯克利 分 校 CSRG 的 4.3+BSD， 运 行 于 惠普 工作 站 上 。 
G) 伯克利 软件 设计 公司 的 BSD/386 (是 BSD Net2 的 变种 )， 运 行 于 Intel 80386 处 理 器 上 。 
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该 系统 与 4.3+BSD 几乎 相同 。 

(4) Sun 公司 的 SunOS 4.1.1 和 4.1.2〈 该 系统 与 伯克利 系统 有 很 深 的 渊源 ， 但 也 包含 了 许多 
系统 V 的 特性 )， 运 行 于 SPARCstation SLC 上 。 

本 书 还 提供 了 许多 对 系统 进行 的 时 间 测 试 ， 并 注 明 了 用 于 测试 的 实际 系统 。 


致谢 


在 过 去 的 一 年 半 中 ， 家 人 给 予 了 我 大 力 支 持 和 爱 ， 因 为 写 书 我 们 失去 了 很 多 快乐 的 周末 ， 我 
深 感 菊 次 。 写 书 从 许多 方面 影响 了 整个 家 庭 。 谢 谢 Sally. Bill, Ellen 和 David. 
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1.1 引言 


所 有 操作 系统 都 为 它们 所 运行 的 程序 提供 服务 。 典 型 的 服务 包括 : 执行 新 程序 、 打 开 文 件 、 读 
文件 、 分 配 存 储 区 以 及 获得 当前 时 间 等 ， 本 书 集中 阐述 不 同 版 本 的 UNIX 操作 系统 所 提供 的 服务 。 

想 要 按 严 格 的 先后 顺序 介绍 UNIX, 而 不 超前 引用 尚未 介绍 过 的 术语 , 这 几乎 是 不 可 能 的 (可 
E 也 会 令 人 厌烦 )。 本 章 从 程序 员 的 角度 快速 浏览 UNIX， 对 书 中 引用 的 一 些 术 语 和 概念 进行 简要 
的 说 明 并 给 出 实例 。 在 以 后 各 章 中 ， 将 对 这 些 概 念 做 更 详细 的 说 明 。 对 于 初 涉 UNIX 环境 的 程序 
员 ， 本 章 还 简要 介绍 了 UNIX 提供 的 各 种 服务 。 


1.2 UNIX 体系 结构 


从 严格 意义 上 说 , 可 将 操作 系统 定义 为 一 种 软件 , 它 控制 计算 机 硬件 资源 , 提供 程序 运行 环境 。 
我 们 通常 将 这 种 软件 称 为 内 核 (kernel)， 因 为 它 相对 较 小 ， 
而 且 位 于 环境 的 核心 。 图 1-1 显示 了 UNIX 系统 的 体系 结构 。 

内 核 的 接口 被 称 为 系统 调用 (system call, 图 1-1 中 的 阴 
影 部 分 )。 公 用 函数 库 构 建 在 系统 调用 接口 之 上 ， 应 用 程序 
既 可 使 用 公用 函数 库 ， 也 可 使 用 系统 调用 。( 我 们 将 在 1.11 
节 对 系统 调用 和 库 函 数 做 更 多 说 明 。) shell 是 一 个 特殊 的 应 
用 程序 ， 为 运行 其 他 应 用 程序 提供 了 一 个 接口 。 

从 广义 上 说 ， 操 作 系统 包括 了 内 核 和 一 些 其 他 软件 ， 这 
些 软件 使 得 计算 机 能 够 发 挥 作用 ， 并 使 计算 机 具有 自己 的 特 
性 。 这 里 所 说 的 其 他 软件 包括 系统 实用 程序 (system utility). 
应 用 程序 、shell 以 及 公用 函数 库 等 。 图 1-1 UNIX 操作 系统 的 体系 结构 

例如 ，Linux 是 GNU 操作 系统 使 用 的 内 核 。 一 些 人 将 这 种 操作 系统 称 为 GNU/Linux 操作 系 
统 ， 但 是 ， 更 常见 的 是 简单 地 称 其 为 Linux。 虽 然 这 种 表达 方法 在 严格 意义 上 讲 并 不 正确 ， 但 鉴 
于 “操作 系统 ”这 个 词 的 双重 含义 ， 这 种 叫 法 还 是 可 以 理解 的 〈 这 样 的 叫 法 更 简洁 )。 


1.8 BR 


1. BRE 
用 户 在 登录 UNIX 系统 时 ， 先 键入 登录 名 ， 然 后 键入 口令 。 系 统 在 其 口令 文件 〈 通 常 是 /etc/ 
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passwd 文件 ) 中 查看 登录 名 。 口 令 文件 中 的 登录 项 由 7 个 以 冒号 分 隔 的 字段 组 成 ， 依 次 是 ， 登录 
名 、 加 密 口令 、 数 字 用 户 ID (205)、 数 字 组 ID (105)、 注 释 字 段 、 起 始 目录 (/home/sar) 以 及 
shell 程序 (/bin/ksh). 

Sar:x:205:105:Stephen Rago:/home/sar:/bin/ksh 

目前 ， 所 有 的 系统 已 将 加 密 口 令 移 到 另 一 个 文件 中 。 第 6 章 将 说 明 这 种 文件 以 及 访问 它们 的 
函数 。 

2. shell 

用 户 登 录 后 ， 系 统 通常 先 显 示 一 些 系统 信息 ， 然 后 用 户 就 可 以 向 shell 程序 键入 命令 。( 当 
用 户 登 录 时 ， 某 些 系 统 启 动 一 个 视窗 管理 程序 ， 但 最 终 总 会 有 一 个 shell 程序 运行 在 一 个 视窗 
H). shell 是 一 个 命令 行 解释 器 ， 它 读 取 用 户 输入 ， 然 后 执行 命令 。shell 的 用 户 输入 通常 来 自 
于 终端 (交互 式 shell)， 有 时 则 来 自 于 文件 〈 称 为 shell 脚本 )。 图 1-2 总 结 了 UNIX 系统 中 常见 
的 shell. 


Bourne | Bouseshell — | /bin/sh bash Sem 
Bourne-again shell /bin/bash 


C shell /bin/csh ny i T tcsh 
Korn shell /bin/ksh . 
TENEX C shell /bin/tcsh 





图 1-2. UNIX 系统 中 常见 的 shell 

系统 从 口令 文件 中 相应 用 户 登 录 项 的 最 后 一 个 字段 中 了 解 到 应 该 为 该 登录 用 户 执 行 哪 一 
个 shell。 

Á V7 以 来 ， 由 Steve Bourne 在 贝尔 实验 室 开 发 的 Bourne shell 得 到 了 广泛 应 用 ， 几 乎 每 一 个 
现 有 的 UNIX 系统 都 提供 Bourne shell， 其 控制 流 结构 类 似 于 Algol 68. 

C shell 是 由 Bill Joy 在 伯克利 开发 的 ， 所 有 BSD 版 本 都 提供 这 种 shell。 另 外 ，AT&T 的 
System V/386 R3.2 和 System V R4 (SVR4) 也 提供 C shell (下 一 章 将 对 这 些 不 同 版 本 的 UNIX 
系统 做 更 多 说 明 )。C shell 是 在 第 6 版 shell 而 非 Bourne shell 的 基础 上 构造 的 ， 其 控制 流 类 似 
于 C 语言 ， 它 支持 Bourne shell 没有 的 一 些 特 色 功 能 ， 例 如 作业 控制 、 历 史 机 制 以 及 命令 行 编 
辑 等 。 

Korn shell 是 Bourne shell 的 后 继 者 ， 它 首先 在 SVR4 中 提供 。Korn shell 是 由 贝尔 实验 室 的 
David Korn 开发 的 ， 在 大 多 数 UNIX 系统 上 运行 ， 但 在 SVR4 之 前 ， 通 常 它 需要 另行 购买 ， 所 以 
没有 其 他 两 种 shell 流行 。 它 与 Bourne shell 向 上 兼容 ， 并 具有 使 C shell 广泛 得 到 应 用 的 一 些 特色 
功能 ， 包 括 作 业 控 制 以 及 命令 行 编辑 等 。 

Bourne-again shell 是 GNU shell, 所 有 Linux 系统 都 提供 这 种 shell。 它 的 设计 遵循 POSIX 
标准 ， 同 时 也 保留 了 与 Bourne shell 的 兼容 性 。 它 支持 C shell 和 Korn shell 两 者 的 特色 
功能 。 

TENEX C shell Æ C shell 的 加 强 版 本 。 它 从 TENEX 操作 系统 (1972 年 BBN 公司 开发 ) 借 
鉴 了 很 多 特色 ， 例 如 命令 完备 。TENEX C shell 在 C shell 基础 上 增加 了 很 多 特性 ， 常 被 用 来 替 
# C shell. 

POSIX 1003.2 标准 对 shell 进行 了 标准 化 。 这 项 规范 基于 Korn shell 和 Bourne shell 的 特性 。 
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不 同 的 Linux 系统 使 用 不 同 的 默认 shell. 一 些 Linux 默认 使 用 Boume-again shell, 另外 一 些 使 用 BSD 
的 对 Bourne shell 的 替代 品 dash ( Debian Almquist shell， 最 早 由 Kenneth Almquist 开发 ， 并 在 后 来 移植 入 
Linux ), FreeBSD 的 默认 用 户 shell 衍生 于 Almquist shell, Mac OS X 的 默认 shell 是 Bourne-again shell. 

Solaries 继承 了 BSD 和 System V 两 者 ， 它 提供 了 图 1-2 中 所 示 的 所 有 shell。 在 因特网 上 可 以 
找到 shell 的 自由 移植 版 软件 。 

本 书 将 使 用 这 种 形式 的 注释 来 描述 历史 注释 ， 并 对 不 同 的 UNIX 系统 的 实现 进行 比较 。 当 我 
们 了 解 到 历史 缘由 后 ， 会 更 好 地 理解 采用 某 种 特定 实现 技术 的 原因 。 


本 书 将 使 用 很 多 交互 式 shell 实例 来 执行 所 开发 的 程序 ， 这 些 实例 使 用 了 Bourne shell. Korn 
shell 和 Bourne-again shell 通用 的 功能 。 


1.4 ”文件 和 目录 


1. 文件 系统 

UNIX 文件 系统 是 目录 和 文件 的 一 种 层次 结构 ， 所 有 东西 的 起 点 是 称 为 根 (root) 的 目录 ,这 
个 目录 的 名 称 是 一 个 字符 “/”。 

目录 (directory〉 是 一 个 包含 目录 项 的 文件 。 在 逻辑 上 ， 可 以 认为 每 个 目录 项 都 包含 一 个 文 
件 名 ， 同 时 还 包含 说 明 该 文件 属性 的 信息 。 文 件 属 性 是 指 文件 类 型 (是 普通 文件 还 是 目录 等 )、 
文件 大 小 、 文 件 所 有 者 、 文件 权限 (其 他 用 户 能 否 访问 该 文件 ) 以 及 文件 最 后 的 修改 时 间 等 。 stat 
和 £stat 函数 返回 包含 所 有 文件 属性 的 一 个 信息 结构 。 第 4 章 将 详细 说 明文 件 的 各 种 属性 。 


目录 项 的 逻辑 视图 与 实际 存放 在 磁盘 上 的 方式 是 不 同 的 。UNIX 文件 系统 的 大 多 数 实现 并 不 
在 目录 项 中 存放 属性 ， 这 是 因为 当 一 个 文件 具有 多 个 硬 链 接 时 ， 很 难保 持 多 个 属性 副本 之 间 的 同 
步 。 这 一 点 将 在 第 4 章 讨论 硬 链 接 时 理解 得 更 明晰 。 


2. 文件 名 
目录 中 的 各 个 名 字 称 为 文件 名 (filename). HARE (/) 和 空 字符 这 两 个 字符 不 能 出 现在 
文件 名 中 。 斜 线 用 来 分 隔 构 成 路 径 名 的 各 文件 名 ， 空 字符 则 用 来 终止 一 个 路 径 名 。 尽 管 如 此 ， 好 
的 习惯 还 是 只 使 用 常用 印刷 字符 的 一 个 子 集 作 为 文件 名 字符 (如 果 在 文件 名 中 使 用 了 某 些 shell 
的 特殊 字符 ， 则 必须 使 用 shell 的 引号 机 制 来 引用 文件 名 ， 这 会 带 来 很 多 麻烦 )。 事 实 上 ， 为 了 可 
移植 性 ，POSIX.1 推荐 将 文件 名 限制 在 以 下 字符 集 之 内 : 字母 (a 一 z、R 一 2)、 数 字 (0 一 9 入 
句点 〈.)、 短 横 线 (-) 和 下 划 线 C D. 
创建 新 目录 时 会 自动 创建 了 两 个 文件 名 : . RAR) 和 . .〔 称 为 点 点 )。 点 指向 当前 目录 ， 
点 点 指向 父 目录 。 在 最 高 层次 的 根 目录 中 ， 点 点 与 点 相同 。 
Research UNIX System 和 某 些 早期 UNIX System V 的 文件 系统 限制 文件 名 的 最 大 长 度 为 14 个 
字符 ，BSD 版 本 则 将 这 种 限制 扩展 为 255 个 字符 。 现 今 ， 几 乎 所 有 商业 化 的 UNIX 文件 系统 都 支 
持 超过 255 个 字符 的 文件 名 。 


3. 路径 名 

由 斜 线 分 隔 的 一 个 或 多 个 文件 名 组 成 的 序列 〈 也 可 以 斜 线 开头 ) 构成 路 径 名 (pathname), WR 
开头 的 路 径 名 称 为 绝对 路 径 名 (absolute pathname)， 否 则 称 为 相对 路 径 名 (relative pathname )。 相 对 路 
径 名 指向 相对 于 当前 目录 的 文件 。 文件 系统 根 的 名 字 (/ ) 是 一 个 特殊 的 绝对 路 径 名 ， 它 不 包含 文件 名 。 
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实例 
不 难 列 出 一 个 目录 中 所 有 文件 的 名 字 ， 图 1-3 是 1s(1) 命 令 的 简要 实现 。 


#include "apue.h" 
#include <dirent.h> 


int 
main(int argc, char *argv[]) 
{ 
DIR *dp; 
struct dirent *dirp; 


if (argc != 2) 
err quit("usage: ls directory name"); 


if ((dp = opendir(argv[1])) == NULL) 
err sys("can't open $s", argv[1]); 
while ((dirp = readdir(dp)) !- NULL) 


printf("$sWn", dirp->d name); 


closedir (dp); 
exit(0); 


图 1-3 列 出 一 个 目录 中 的 所 有 文件 
1s(1) 这 种 表示 方法 是 UNIX 系统 的 惯用 方法 ， 用 以 引用 UNIX 系统 手册 中 的 一 个 特定 项 。 
1s(1) 引 用 第 一 部 分 中 的 1s 项 。 各 部 分 通常 用 数字 1 一 8 编号 ， 在 每 个 部 分 中 的 各 项 则 按 字母 顺 
序 排列 。 在 本 书 中 始终 假定 你 有 自己 所 使 用 的 UNIX 系统 的 手册 。 


| 早期 的 UNIX 系统 把 8 个 部 分 都 集中 在 一 本 《UNIX 程序 员 手 册 》( UNIX Programmer 5 
| Manual) 中 。 随 着 页 数 的 增加 ， 现 在 的 趋势 是 把 这 些 部 分 分 别 安排 在 不 同 的 手册 中 ， 例 如 用 户 
| 手册 、 程 序 员 手册 以 及 系统 管理 员 手 册 等 。 
ak UNIX 系统 用 大 写字 母 把 某 一 部 分 手册 进一步 分 成 若干 小 部 分 ， 例 如，AT&T[1990e] 中 
的 所 有 标准 VO 函数 都 被 指明 位 于 3S 部 分 中 , 例如 fopen(3S)。 另 一 些 UNIX 系统 不 用 数字 而 是 
用 字母 将 手册 分 成 若干 部 分 ， 如 用 C 表示 命令 部 分 等 。 


WA, 大 多 数 手册 都 以 电子 文档 形式 提供 。 如 果 用 的 是 联机 手册 ， 则 可 用 下 面 的 命令 查看 ls 
命令 手册 页 : 

man 1 1s 
或 

man -sl 1s 


图 1-3 只 打印 一 个 目录 中 各 个 文件 的 名 字 ， 不 显示 其 他 信息 ， 如 果 该 源 文 件 名 为 myls.c， 
则 可 以 用 下 面 的 命令 对 其 进行 编译 ， 编 译 结果 是 生成 默认 名 为 a.out 的 可 执行 文件 中 。 


cc myls.c 
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历史 上 ，cc(]) 是 C 编译 器 。 在 配置 了 GNUC 编译 系统 的 系统 中 ，C 编译 器 是 gcc(1)。 其 中 ， 
cc 通常 链接 至 gcc. 


示例 输出 如 下 : 


$ ./a.out /dev 


很 多 行 未 显示 
mem 
$ ./a.out /etc/ssl/private 
can't open /etc/ssl/private: Permission denied 
$ ./a.out /dev/tty 
can't open /dev/tty: Not a directory 


本 书 将 以 以 下 方式 表示 输入 的 命令 及 其 输出 : 输入 的 字符 以 等 宽 粗 体 表 示 ， 程 序 输出 则 以 上 
面 所 示 的 等 宽 字体 表示 。 对 输出 的 注释 以 中 文 宋体 表示 。 输 入 之 前 的 美元 符号 C$) 是 shell 的 提 [ 6 | 
示 符 ， 本 书 总 是 将 shell 提示 符 表 示 为 $。 

注意 , myls 程序 列 出 的 目录 中 的 文件 名 不 是 以 字母 顺序 列 出 的 , 而 1s 命令 一 般 是 按 字母 顺 
序 打印 目录 项 。 

在 这 个 20 行 的 程序 中 ， 有 很 多 细节 需要 考虑 。 

。 首先， 其 中 包含 了 一 个 头 文件 apue .h。 本 书 中 几乎 每 一 个 程序 都 包含 此 头 文件 。 它 包含 

了 某 些 标准 系统 头 文件 ， 定 义 了 许多 常量 及 函数 原型 ， 这 些 都 将 用 于 本 书 的 各 个 实例 中 ， 
附录 B 列 出 了 这 一 头 文件 。 

e 接 下 来 ， 我 们 包含 了 一 个 系统 头 文件 dirent .h， 以 便 使 用 opendir fll readdir 的 函 

数 原型 ， 以 及 dirent 结构 的 定义 。 在 其 他 一 些 系统 里 ， 这 些 定义 被 分 成 多 个 头 文件 。 
比如 ， 在 Ubuntu 12.04 中 ，/usr/include/dirent.h 声明 了 函数 原型 ， 并 且 包含 
bits/dirent.h， 后 者 定义 了 dirent 结构 (真正 存放 在 /usr/include/x86_64- 
linux-gnu/bits 下 )。 

。 main 函数 的 声明 使 用 了 ISO C 标准 所 使 用 的 风格 〈 下 一 章 将 对 ISO C 标准 进行 更 多 

说 明 )。 
。 程序 获取 命令 行 的 第 1 个 参数 argv [1] 作为 要 列 出 其 各 个 目录 项 的 目录 名 。 第 7 章 将 说 
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明 main 函数 如 何 被 调用 ， 程 序 如 何 存 取 命 令 行 参数 和 环境 变量 。 

。 因为 各 种 不 同 UNIX 系统 目录 项 的 实际 格式 是 不 一 样 的 ， 所 以 使 用 函数 opendir. 
readdir 和 closedir 对 目录 进行 处 理 。 

e opendir 函数 返回 指向 DIR 结构 的 指针 ， 我 们 将 该 指针 传送 给 readdir 函数 。 我 们 并 
不 关心 DIR 结构 中 包含 了 什么 。 然 后 ， 在 循环 中 调用 readdir 来 读 每 个 目录 项 。 它 返 
回 一 个 指向 dirent 结构 的 指针 ， 而 当 目录 中 已 无 目录 项 可 读 时 则 返回 null 指针 。 在 
dirent 结构 中 取出 的 只 是 每 个 目录 项 的 名 字 (d_name )。 使 用 该 名 字 ， 此 后 就 可 调用 
stat Kğ IL 4.2 节 ) 以 获得 该 文件 的 所 有 属性 。 

。 程序 调用 了 两 个 自 编 的 函数 对 错误 进行 处 理 : err sys 和 err_quit。 从 上 面 的 输出 中 
可 以 看 到 ，err_sys 函数 打印 一 条 消息 (“Permission denied” 或 “Not a directory”), tit 
明 遇 到 了 什么 类 型 的 错误 。 这 两 个 出 错 处 理 函 数 在 附录 B. 中 说 明 ，1.7 节 将 更 多 地 叙述 出 
错 处 理 。 

e 当 程 序 将 结束 时 ， 它 以 参数 0 调用 函数 exit. A% exit 终止 程序 。 按 惯例 ， 参 数 0 的 
意思 是 正常 结束 ， 参 数值 1 一 255 则 表示 出 错 。8.5 节 将 说 明 一 个 程序 〈 如 shell 或 我 们 所 
编写 的 程序 ) 如 何 获得 它 所 执行 的 另 一 个 程序 的 exit 状态 。 C 


4. 工作 目录 

每 个 进程 都 有 一 个 工作 目录 (working directory)， 有 时 称 其 为 当前 工作 目录 (current working 
directory)。 所 有 相对 路 径 名 都 从 工作 目录 开始 解释 。 进 程 可 以 用 chdir 函数 更 改 其 工作 目录 。 

例如 ， 相 对 路 径 名 doc/memo/joe 指 的 是 当前 工作 目录 中 的 doc 目录 中 的 memo 目录 中 的 
文件 (或 目录 ) joe。 从 该 路 径 名 可 以 看 出 ，doc 和 memo 都 应 当 是 目录 ， 但 是 却 不 能 分 辨 joe 
是 文件 还 是 目录 。 路 径 名 /urs/1ib/1int 是 一 个 绝对 路 径 名 , 它 指 的 是 根 目录 中 的 usr 目录 中 
W lib 目录 中 的 文件 (或 目录 ) lint. 

5. WHR 

登录 时 ， 工 作 目 录 设 置 为 起 始 目录 (home directory )， 该 起 始 目 录 从 口令 文件 ( 见 1.3 节 ) 中 
相应 用 户 的 登录 项 中 取得 。 


1.5 输入 和 输出 


1. 文件 描述 符 

文件 描述 符 (file descriptor) 通常 是 一 个 小 的 非 负 整数 ， 内 核 用 以 标识 一 个 特定 进程 正在 访 
问 的 文件 。 当 内 核 打 开 一 个 现 有 文件 或 创建 一 个 新 文件 时 ， 它 都 返回 一 个 文件 描述 符 。 在 读 、 写 
文件 时 ， 可 以 使 用 这 个 文件 描述 符 。 

2. 标准 输入 、 标 准 输 出 和 标准 错误 

按 惯例 ， 每 当 运行 一 个 新 程序 时 ， 所 有 的 shell 都 为 其 打开 3 个 文件 描述 符 ， 即 标准 输入 
(standard input)、 标 准 输 出 (standard output) 以 及 标准 错误 (standard error)。 如 果 不 做 特殊 处 理 ， 
例如 就 像 简单 的 命令 1s， 则 这 3 个 描述 符 都 链接 向 终端 。 大 多 数 shell 都 提供 一 种 方法 ， 使 其 中 
任何 一 个 或 所 有 这 3 个 描述 符 都 能 重新 定向 到 某 个 文件 ， 例 如 : 


is  file.list 


执行 1s 命令 ， 其 标准 输出 重新 定向 到 名 为 file .1ist 的 文件 。 


1.5 输入 和 输出 7 


3. 不 带 缓冲 的 MO 
函数 open. read. write, lseek 以 及 close 提供 了 不 带 缓冲 的 IO。 这 些 函 数 都 使 用 文 
件 描述 符 。 


| 实例 
如 果 愿 意 从 标准 输入 读 ， 并 向 标准 输出 写 ， 则 图 1-4 中 所 示 的 程序 可 用 于 复制 任 一 UNIX 普 

通 文件 。 

#include "apue.h" 


#define BUFFSIZE 4096 


int 
main (void) 
{ 
int n; 
char buf [BUFFSIZE]; 


while ((n = read(STDIN FILENO, buf, BUFFSIZE)) > 0) 
if (write(STDOUT FILENO, buf, n) !- n) 
err sys("write error"); 


if (n « 0) 
err sys("read error"); 


exit(0); 


1-4. 将 标准 输入 复制 到 标准 输出 

头 文件 <unistd.h> (apue.h 中 包含 了 此 头 文件 ) 及 两 个 常量 STDIN FILENO 和 STDOUT_ 
FILENO 是 POSIX 标准 的 一 部 分 〈 下 一 章 将 对 此 做 更 多 的 说 明 )。 头 文件 <unistd.h> 包 含 了 很 
多 UNIX 系统 服务 的 函数 原型 ， 例 如 图 1-4 程序 中 调用 的 read 和 write。 

两 个 常量 STDIN FILENO 和 STDOUT FILENO 定义 在 <unistd.h> 头 文件 中 ， 它 们 指定 了 
标准 输入 和 标准 输出 的 文件 描述 符 。 在 POSIX 标准 中 ， 它 们 的 值 分 别 是 0 和 1， 但 是 考虑 到 可 读 
性 ， 我 们 将 使 用 这 些 名 字 来 表示 这 些 常量 。 

3.9 节 将 详细 讨论 BUFFSIZE 常量 ， 说 明 它 的 各 种 不 同 值 将 如 何 影响 程序 的 效率 。 但 是 不 管 
该 常量 的 值 如 何 ， 此 程序 总 能 复制 任 一 UNIX 普通 文件 。 

read 函数 返回 读 取 的 字 节 数 ， 此 值 用 作 要 写 的 字 节 数 。 当 到 达 输 入 文件 的 尾 端 时 ，read 返 
回 0， 程 序 停止 执行 。 如 果 发 生 了 一 个 读 错误 ，read 返回 -1。 出 错时 大 多 数 系统 函数 返回 -1。 

如 果 将 该 程序 编译 成 标准 名 称 的 aout 文件 ， 并 以 下 列 方式 执行 它 : 

./a.out > data 
那么 标准 输入 是 终端 ， 标 准 输出 则 重新 定向 至 文件 data， 标 准 错误 也 是 终端 。 如 果 此 输出 文件 
并 不 存在 ， 则 shell 会 创建 它 。 该 程序 将 用 户 键入 的 各 行 复制 到 标准 输出 ,键入 文件 结束 符 (通常 
是 Ctrl+D) 时 ， 将 终止 本 次 复制 。 

若 以 下 列 方式 执行 该 程序 : 


./a.out < infile > outfile 


[9] 
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会 将 名 为 infile 文件 的 内 容 复制 到 名 为 outfile 的 文件 中 。 图 

第 3 章 将 更 详细 地 说 明 不 带 缓 冲 的 IO 函数 。 

4. 标准 I/O 

标准 VO 函数 为 那些 不 带 缓冲 的 IO 函数 提供 了 一 个 带 缓冲 的 接口 。 使 用 标准 VO 函数 无 需 
担心 如 何 选取 最 佳 的 缓冲 区 大 小 ， 如 图 1-4 中 的 BUFFSIZE 常量 的 大 小 。 使 用 标准 IO 函数 还 简 
化 了 对 输入 行 的 处 理 (常常 发 生 在 UNIX 的 应 用 程序 中 )。 例 如 ，fgets 函数 读 取 一 个 完整 的 行 ， 
而 read 函数 读 取 指定 字 节 数 。 在 5.4 节 中 我 们 将 了 解 到 ， 标 准 VO 函数 库 提供 了 使 我 们 能 够 控 
制 该 库 所 使 用 的 缓冲 风格 的 函数 。 

我 们 最 熟悉 的 标准 UO 函数 是 printf。 在 调用 printf 的 程序 中 , 总 是 包含 <stdio.h>( 在 
本 书 中 ， 该 头 文件 包含 在 apue .h 中 )， 该 头 文件 包括 了 所 有 标准 VO 函数 的 原型 。 


a XP 
图 1-5 程序 的 功能 类 似 于 前 一 个 调用 了 read 和 write 的 程序 ，5.8 节 将 对 此 程序 进行 更 详 
细 的 说 明 。 它 将 标准 输入 复制 到 标准 输出 ， 也 就 能 复制 任 一 UNIX 普通 文件 。 
#include "apue.h" 
int 
main (void) 


{ 


int c; 
while ((c = getc(stdin)) != EOF) 


if (putc(c, stdout) -- EOF) 
err sys("output error"); 


if (ferror(stdin)) 
err sys("input error"); 


exit(0); 


图 1-5 用 标准 VO 将 标准 输入 复制 到 标准 输出 
函数 gete 一 次 读 取 一 个 字符 ， 然 后 函数 pute 将 此 字符 写 到 标准 输出 。 读 到 输入 的 最 后 一 
个 字 节 时 , getc 返回 常量 EOF (该 常量 在 <stdio .h> 中 定义 )。 标 准 VO 常量 stdin 和 stdout 


也 在 头 文件 <staio.h> 中 定义 ， 它 们 分 别 表示 标准 输入 和 标准 输出 。 ^ 
1.6 ”程序 和 进程 
1. 程序 


程序 (program) 是 一 个 存储 在 磁盘 上 某 个 目录 中 的 可 执行 文件 。 内 核 使 用 exec 函数 《7 个 
exec 函数 之 一 )， 将 程序 读 入 内 存 ， 并 执行 程序 。8.10 节 将 说 明 这 些 exec 函数 。 

2， 进 程 和 进程 ID 

程序 的 执行 实例 被 称 为 进程 (process)。 本 书 的 每 一 页 几乎 都 会 使 用 这 一 术语 。 某 些 操 作 系 
统 用 任务 (task) 表示 正在 被 执行 的 程序 。 
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UNIX 系统 确保 每 个 进程 都 有 一 个 唯一 的 数字 标识 符 ， 称 为 进程 ID (process ID )。 进 程 ID 总 
是 一 个 非 负 整数 。 
NT 

图 1-6 程序 用 于 打印 进程 ID。 


#include "apue.h" 





int 
main (void) 
{ 
printf ("hello world from process ID %ld\n", (long) getpid()); 


exit (0); 
} 
图 1-6 打印 进程 ID 
如 果 将 该 程序 编译 成 a.out 文件 ， 然 后 执行 它 ， 则 有 : 
$ ./a.out 
hello world from process ID 851 
$ ./a.out 


hello world from process ID 854 
此 程序 运行 时 ， 它 调用 函数 getpia 得 到 其 进程 ID 。 我 们 将 会 在 后 面 看 到 ，getpia 返回 一 个 
pid t 数据 类 型 。 我 们 不 知道 它 的 大 小 ， 仅 知道 的 是 标准 会 保证 它 能 保存 在 一 个 长 整 型 中 。 因 为 
我 们 必须 在 printf 函数 中 指定 需要 打印 的 每 一 个 变量 的 大 小 ， 所 以 我 们 必须 把 它 的 值 强制 转换 
为 它 可 能 会 用 到 的 最 大 的 数据 类 型 〈 这 里 是 长 整 型 )。 虽 然 大 多 数 进程 ID 可 以 用 整 型 表示 ， 但 用 


长 整 型 可 以 提高 可 移植 性 。 
3. 进程 控制 


有 3 个 用 于 进程 控制 的 主要 函数 : fork. exec 和 waitpid. (exec 函数 有 7 种 变 体 ， 但 
经 常 把 它们 统称 为 exec 函数 。) 


s BA 
UNIX 系统 的 进程 控制 功能 可 以 用 一 个 简单 的 程序 说 明 ( 见 图 1-7)。 该 程序 从 标准 输入 读 取 
命令 ， 然 后 执行 这 些 命令 。 它 类 似 于 shell 程序 的 基本 实施 部 分 。 [11] 


#include "apue.h" 
#include <sys/wait.h> 


int 

main (void) 

{ 
char buf [MAXLINE] ; /* from apue.h */ 
pid t pid; 
int status; 


printf("55 "); /* print prompt (printf requires $$ to print $) */ 
while (fgets(buf, MAXLINE, stdin) != NULL) { 
if (buf[strlen(buf) - 1] == '\n') 
buf[strlen(buf) - 1] = 0; /* replace newline with null */ 


[12 | 
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} 


if ((pid = fork()) < 0) { 
err sys("fork error"); 

] else if (pid == 0) { /* child */ 
execlp(buf, buf, (char *)0); 
err ret("couldn't execute: %s", buf); 
exit(127); 

) 


/* parent */ 

if ((pid = waitpid(pid, &status, 0)) < 0) 
err sys("waitpid error"); 

printf("$$ "); 


exit(0); 





图 1-7 从 标准 输入 读 命令 并 执行 


在 这 个 30 行 的 程序 中 ， 有 很 多 功能 需要 考虑 。 


用 标准 VO 函数 fgets 从 标准 输入 一 次 读 取 一 行 。 当 键入 文件 结束 符 (通常 是 Ctrl+D) 作 
为 行 的 第 一 个 字符 时 ，fgets 返回 一 个 null 指针 ， 于 是 循环 停止 ， 进 程 也 就 终止 。 第 18 
章 将 说 明 所 有 特殊 的 终端 字符 〈 文 件 结束 、 退 格 字符 、 整 行 探 除 等 )， 以 及 如 何 改变 它们 。 
因为 fgets 返回 的 每 一 行 都 以 换行 符 终止 ， 后 随 一 个 null 字 节 ， 因 此 用 标准 C 函数 strlen 
计算 此 字符 串 的 长 度 ， 然 后 用 一 个 null 字 节 替换 换行 符 。 这 样 做 是 因为 execlp 函数 要 
求 的 参数 是 以 null 结束 的 而 不 是 以 换行 符 结束 的 。 

调用 fork 创建 一 个 新 进程 。 新 进程 是 调用 进程 的 一 个 副本 ， 我 们 称 调 用 进程 为 父 进程 ， 
新 创建 的 进程 为 子 进程 。fork 对 父 进程 返回 新 的 子 进 程 的 进程 ID 〈 一 个 非 负 整数 )， 对 
子 进程 则 返回 0。 因 为 fork 创建 一 个 新 进程 ， 所 以 说 它 被 调用 一 次 〈 由 父 进程 )， 但 返 
回 两 次 〈 分 别 在 父 进 程 中 和 在 子 进程 中 )。 

在 子 进程 中 ， 调 用 execlp 以 执行 从 标准 输入 读 入 的 命令 。 这 就 用 新 的 程序 文件 替换 了 
子 进程 原先 执行 的 程序 文件 。fork 和 跟随 其 后 的 exec 两 者 的 组 合 就 是 某 些 操 作 系 统 所 
称 的 产生 〈spawn) 一 个 新 进程 。 在 UNIX 系统 中 ， 这 两 部 分 分 离 成 两 个 独立 的 函数 。 第 
8 章 将 对 这 些 函 数 进行 更 多 说 明 。 

子 进程 调用 execlp 执行 新 程序 文件 ， 而 父 进 程 希望 等 待 子 进 程 终 止 ， 这 是 通过 调用 
waitpid 实现 的 ， 其 参数 指定 要 等 待 的 进程 C pia 参数 是 子 进程 ID). waitpid A 
数 返 回 子 进 程 的 终止 状态 (status 变量 )。 在 我 们 这 个 简单 的 程序 中 ， 没 有 使 用 该 值 。 
如 果 需 要 ， 可 以 用 此 值 准确 地 判定 子 进程 是 如 何 终止 的 。 

该 程序 的 最 主要 限制 是 不 能 向 所 执行 的 命令 传递 参数 。 例 如 不 能 指定 要 列 出 目录 项 的 目 
录 名 ， 只 能 对 工作 目录 执行 1s 命令 。 为 了 传递 参数 ， 先 要 分 析 输 入 行 ， 然 后 用 某 种 约定 
把 参数 分 开 〈 可 能 使 用 空格 或 制 表 符 )， 再 将 分 隔 后 的 各 个 参数 传递 给 execlp MAM. JS 
管 如 此 ， 此 程序 仍 可 用 来 说 明 UNIX 系统 的 进程 控制 功能 。 


如 果 运 行 此 程序 ， 将 得 到 下 列 结果 。 注 意 ， 该 程序 使 用 了 一 个 不 同 的 提示 符 〈s#)， 以 区 别 于 
shell 的 提示 符 。 


$ 


./a.out 


* date 
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Sat Jan 21 19:42:07 EST 2012 
% who 
sar console Jan 1 14:59 
sar ttys000 Jan 1 14:59 
sar ttys001 Jan 15 15:28 
% pwd 
/home/sar/bk/apue/3e 
$ 1s 
Makefile 
a.out 
shelll.c 
% ^D 键入 文件 结束 符 
$ 常规 的 shell 提示 符 
^D 表示 一 个 控制 字符 。 控 制 字符 是 特殊 字符 ,其 构成 方法 是 : 在 键盘 上 按 下 控制 键 通常 
被 标记 为 Control 或 Ctrl， 同 时 按 另 一 个 键 。CtrItD 或 ^D 是 默认 的 文件 结束 符 。 在 第 18 章 中 


讨论 终端 IO 时 ， 会 介绍 更 多 的 控制 字符 。 


4. 线程 和 线程 ID 

通常 ， 一 个 进程 只 有 一 个 控制 线程 (thread) 一 一 某 一 时 刻 执行 的 一 组 机 器 指令 。 对 于 某 些 
问题 ， 如 果 有 多 个 控制 线程 分 别 作用 于 它 的 不 同 部 分 ， 那 么 解决 起 来 就 容易 得 多 。 另 外 ， 多 个 控 
制 线程 也 可 以 充分 利用 多 处 理 器 系统 的 并 行 能 力 。 

一 个 进程 内 的 所 有 线程 共享 同一 地 址 空间 、 文 件 描述 符 、 栈 以 及 与 进程 相关 的 属性 。 因 为 它 
们 能 访问 同一 存储 区 ， 所 以 各 线程 在 访问 共享 数据 时 需要 采取 同步 措施 以 避免 不 一 致 性 。 

与 进程 相同 ， 线 程 也 用 ID 标识 。 但 是 ， 线 程 ID 只 在 它 所 属 的 进程 内 起 作用 。 一 个 进程 中 的 
线程 ID 在 另 一 个 进程 中 没有 意义 。 当 在 一 进程 中 对 某 个 特定 线程 进行 处 理 时 ， 我 们 可 以 使 用 该 
线程 的 ID 引用 它 。 

控制 线程 的 函数 与 控制 进程 的 函数 类 似 , 但 另 有 一 套 。 线 程 模 型 是 在 进程 模型 建立 很 久之 后 才 被 
引入 到 UNIX 系统 中 的 ， 然 而 这 两 种 模型 之 间 存在 复杂 的 交互 ， 在 第 12 章 中 ,我们 会 对 此 进行 说 明 。 


1.7 出错 处 理 


当 UNIX 系统 函数 出 错时 ， 通 常会 返回 一 个 负 值 ， 而 且 整 型 变量 errno 通常 被 设置 为 具有 特定 
信息 的 值 。 例 如 ，open 函数 如 果 成 功 执行 则 返回 一 个 非 负 文件 描述 符 ， 如 出 错 则 返回 一 1。 在 open 
出 错时 ， 有 大 约 15 种 不 同 的 errno 值 〈 文 件 不 存在 、 权 限 问 题 等 )。 而 有 些 函 数 对 于 出 错 则 使 用 另 
一 种 约定 而 不 是 返回 负 值 。 例 如 ， 大 多 数 返 回 指 向 对 象 指针 的 函数 ， 在 出 错时 会 返回 一 个 null 指针 。 

文件 <errno.h> 中 定义 了 errno 以 及 可 以 赋 与 它 的 各 种 常量 。 这 些 常量 都 以 字符 E 开头 。 
另外 ，UNIX 系统 手册 第 2 部 分 的 第 1 页 ，intro(2) 列 出 了 所 有 这 些 出 错 常量 。 例 如 ， 若 errno 
等 于 常量 EACCES， 表 示 产 生 了 权限 问题 (例如 ， 没 有 足够 的 权限 打开 请 求 文件 )。 


在 Linux 中 ， 出 错 常量 在 errno(3) 手 册页 中 列 出 。 


POSIX 和 ISO C 将 errno 定义 为 一 个 符号 ， 它 扩展 成 为 一 个 可 修改 的 整形 左 值 (value). 
它 可 以 是 一 个 包含 出 错 编号 的 整数 , 也 可 以 是 一 个 返回 出 错 编 号 指针 的 函数 。 以 前 使 用 的 定义 是 : 


extern int errno; 
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但 是 在 支持 线程 的 环境 中 ， 多 个 线程 共享 进程 地 址 空间 ， 每 个 线程 都 有 属于 它 自 己 的 局 部 errno 
以 避免 一 个 线程 干扰 另 一 个 线程 。 例 如 ，Linux 支持 多 线程 存 取 errno， 将 其 定义 为 : 


extern int * errno _ location(void) 
#define errno (* errno location()) 


此 ， 仅 当 函 数 的 返回 值 指明 出 错时 ， 才 检验 其 值 。 第 二 条 规则 是 ， 任何 函数 都 不 会 将 errno fii 
设置 为 0， 而 且 在 <errno .h> 中 定义 的 所 有 常量 都 不 为 0。 
C 标准 定义 了 两 个 函数 ， 它 们 用 于 打印 出 错 信息 。 


#include <string.h> 








char *strerror(int errnum) ; 





返回 值 : 指向 消息 字符 串 的 指针 
strerror 函数 将 errnum (通常 就 是 errno 值 ) 映射 为 一 个 出 错 消 息 字 符 串 ， 并 且 返 回 此 
字符 串 的 指针 。 
perror 图 数 基 于 errno 的 当前 值 ， 在 标准 错误 上 产生 一 条 出 错 消 息 ， 然 后 返回 。 


void perror(const char *msg); 
它 首先 输出 由 msg 指向 的 字符 串 ， 然 后 是 一 个 冒号 ， 一 个 空格 ， 接 着 是 对 应 于 errno 值 的 
出 错 消息 ， 最 后 是 一 个 换行 符 。 


s 3 
图 1-8 程序 显示 了 这 两 个 出 错 函 数 的 使 用 方法 。 


#include "apue.h" 








#include <errno.h> 


int 
main(int argc, char *argv[]) 
{ 
fprintf(stderr, "EACCES: %s\n", strerror(EACCES)); 
errno = ENOENT; 
perror(argv[0]); 
exit(0); 





图 1-8 Silas strerror 和 Perror 
如 果 将 此 程序 编译 成 文件 a.out， 然 后 执行 它 ， 则 有 


$ .fa.out 
EACCES: Permission denied 
./a.out: No such file or directory 


注意 ， 我 们 将 程序 名 (argv[0] ， 其 值 是 . /a.out) 作为 参数 传递 给 Perror。 这 是 一 个 标准 的 
UNIX 惯例 。 使 用 这 种 方法 ， 在 程序 作为 管道 的 一 部 分 执行 时 ， 例 如 : 


progl < inputfile | Prog2 | prog3 > outputfile 
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我 们 就 能 分 清 3 个 程序 中 的 哪 一 个 产生 了 一 条 特定 的 出 错 消息 。 E 


本 书 中 的 所 有 实例 基本 上 都 不 直接 调用 strerror Mperror, 而 是 使 用 附录 B 中 的 出 错 函 
数 。 该 附录 中 的 出 错 函 数 使 我 们 只 用 一 条 C 语句 就 可 利用 ISO C 的 可 变 参数 表 功 能 处 理 出 错 情况 。 

出 错 恢 复 

可 将 在 <errno.h> 中 定义 的 各 种 出 错 分 成 两 类 :致命 性 的 和 非 致命 性 的 .对 于 致命 性 的 错误 ， 
无 法 执行 恢复 动作 。 最 多 能 做 的 是 在 用 户 屏幕 上 打印 出 一 条 出 错 消息 或 者 将 一 条 出 错 消息 写 入 日 
志文 件 中 ， 然 后 退出 。 对 于 非 致命 性 的 出 错 ， 有 时 可 以 较 妥 善 地 进行 处 理 。 大 多 数 非 致命 性 出 错 
是 暂时 的 〈 如 资源 短缺 )， 当 系统 中 的 活动 较 少 时 ， 这 种 出 错 很 可 能 不 会 发 生 。 

与 资源 相关 的 非 致 命 性 出 错 包 括 : EAGAIN. ENFILE. ENOBUFS. ENOLCK. ENOSPC, 
EWOULDBLOCK， 有 时 ENOMEM 也 是 非 致命 性 出 错 。 当 EBUSY 指明 共享 资源 正在 使 用 时 ， 也 可 将 
它 作为 非 致 命 性 出 错 处 理 。 当 EINTR 中 断 一 个 慢 速 系统 调用 时 ， 可 将 它 作为 非 致命 性 出 错 处 理 
(在 10.5 节 对 此 会 进行 更 多 说 明 )。 

对 于 资源 相关 的 非 致 命 性 出 错 的 典型 恢复 操作 是 延迟 一 段 时 间 ， 然 后 重 试 。 这 种 技术 可 应 用 
于 其 他 情况 。 例 如 ， 假 设 出 错 表明 一 个 网 络 连接 不 再 起 作用 ， 那 么 应 用 程序 可 以 采用 这 种 方法 ， 
在 短 时 间 延 迟 后 ， 尝 试 重建 该 连接 。 一 些 应 用 使 用 指数 补偿 算法 ， 在 每 次 迭代 中 等 待 更 长 时 间 。 

最 终 ， 由 应 用 的 开发 者 决定 在 哪些 情况 下 应 用 程序 可 以 从 出 错 中 恢复 。 如 果 能 够 采用 一 种 合 
理 的 恢复 策略 ， 那 么 可 以 避免 应 用 程序 异常 终止 ， 进 而 就 能 改善 应 用 程序 的 健壮 性 。 
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1. BP ID 

口令 文件 登录 项 中 的 用 户 ID (userID) 是 一 个 数值 ， 它 向 系统 标识 各 个 不 同 的 用 户 。 系 统 
管理 员 在 确定 一 个 用 户 的 登录 名 的 同时 , 确定 其 用 户 ID. 用户 不 能 更 改 其 用 户 ID。 通常 每 个 用 
户 有 一 个 唯一 的 用 户 ID。 下 面 将 介绍 内 核 如 何 使 用 用 户 ID 来 检验 该 用 户 是 否 有 执行 某 些 操作 
的 权限 。 

用 户 ID 为 0 的 用 户 为 根 用 户 (root) 或 超级 用 户 (superuser)。 在 口令 文件 中 ， 通 常 有 一 个 
登录 项 ， 其 登录 名 为 root， 我 们 称 这 种 用 户 的 特权 为 超级 用 户 特 权 。 我 们 将 在 第 4 章 中 看 到 ， 
如 果 一 个 进程 具有 超级 用 户 特 权 ， 则 大 多 数 文件 权限 检查 都 不 再 进行 。 某 些 操 作 系统 功能 只 向 超 
级 用 户 提供 ， 超 级 用 户 对 系统 有 自由 的 支配 权 。 

Mac OS X 客户 端 版 本 交 由 用 户 使 用 时 ,禁用 超级 用 户 账户 , 服务 器 版 本 则 可 使 用 该 账户 。 在 
Apple 的 网 站 可 以 找到 使 用 说 明 ， 它 告知 如 何 才 能 使 用 该 账户 。 参 见 http://support. 
apple.com/kb/HT1528. 


2. 组 ID 

口令 文件 登录 项 也 包括 用 户 的 组 ID (group ID)， 它 是 一 个 数值 。 组 ID 也 是 由 系统 管理 
员 在 指定 用 户 登 录 名 时 分 配 的 。 一 般 来 说 ， 在 口令 文件 中 有 多 个 登录 项 具有 相同 的 组 ID 。 组 
被 用 于 将 若干 用 户 集合 到 项 目 或 部 门 中 去 。 这 种 机 制 允 许 同 组 的 各 个 成 员 之 间 共 享 资源 〈 如 
文件 )。4.5 节 将 介绍 可 以 通过 设置 文件 的 权限 使 组 内 所 有 成 员 都 能 访问 该 文件 ， 而 组 外 用 户 
不 能 访问 。 

组 文件 将 组 名 映射 为 数值 的 组 ID。 组 文件 通常 是 /etc/group。 
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使 用 数值 的 用 户 ID 和 数值 的 组 ID 设置 权限 是 历史 上 形成 的 。 对 于 磁盘 上 的 每 个 文件 ， 文 件 
系统 都 存储 该 文件 所 有 者 的 用 户 ID 和 组 ID。 存储 这 两 个 值 只 需 4 个 字 节 (假定 每 个 都 以 双 字 节 
的 整 型 值 存放 )。 如 果 使 用 完整 ASCI 登录 名 和 组 名 ， 则 需 更 多 的 磁盘 空间 。 另 外 ， 在 检验 权限 
期 间 ， 比 较 字 符 串 较 之 比较 整 型 数 更 消耗 时 间 。 

但 是 对 于 用 户 而 言 ， 使 用 名 字 比 使 用 数值 方便 ， 所 以 口令 文件 包含 了 登录 名 和 用 户 ID 之 间 
的 映射 关系 ， 而 组 文件 则 包含 了 组 名 和 组 ID 之 间 的 映射 关系 。 例 如 ，1s -1 命令 使 用 口令 文件 
将 数值 的 用 户 ID 映射 为 登录 名 ， 从 而 打印 出 文件 所 有 者 的 登录 名 。 


早期 的 UNIX 系统 使 用 16 位 整 型 数 表 示 用 户 ID 和 组 ID。 现今 的 UNIX. 系统 使 用 32 位 整 型 
数 表示 用 户 ID 和 组 ID。 


和 实例 
图 1-9 程序 用 于 打印 用 户 ID 和 组 ID。 


#include "apue.h" 


int 

main (void) 

{ 
printf ("uid = $d, gid = d\n", getuid(), getgid()); 
exit (0); 





图 1-9 打印 用 户 ID 和 组 ID 
程序 调用 getuid 和 getgid 以 返回 用 户 ID 和 组 DD。 运行 该 程序 的 结果 如 下 : 


$ ./a.out 
uid = 205, gid = 105 E] 


3. 附属 组 ID 

除了 在 口令 文件 中 对 一 个 登录 名 指定 一 个 组 ID 外 ， 大 多 数 UNIX 系统 版 本 还 允许 一 个 用 户 
属于 另外 一 些 组 。 这 一 功能 是 从 4.2BSD 开始 的 ， 它 允许 一 个 用 户 属于 多 至 16 个 其 他 的 组 。 登 录 
时 ， 读 文件 /etc/group， 寻 找 列 有 该 用 户 作为 其 成 员 的 前 16 个 记录 项 就 可 以 得 到 该 用 户 的 附 
/&28 ID (supplementary group ID)。 在 下 一 章 将 说 明 ，POSIX 要 求 系统 至 少 应 支持 8 个 附属 组 ， 
实际 上 大 多 数 系 统 至 少 支持 16 个 附属 组 。 


1.9 信号 


信号 (signal) 用 于 通知 进程 发 生 了 某 种 情况 。 例 如 ， 若 某 一 进程 执行 除法 操作 ， 其 除数 为 0， 
则 将 名 为 SIGEPE ( 浮 点 异常 ) 的 信号 发 送 给 该 进程 。 进 程 有 以 下 3 种 处 理 信号 的 方式 。 

(1) 忽略 信号 。 有 些 信号 表示 硬件 异常 ， 例 如 ， 除 以 0 或 访问 进程 地 址 空间 以 外 的 存储 单元 
等 ， 因 为 这 些 异 常 产生 的 后 果 不 确定 ， 所 以 不 推荐 使 用 这 种 处 理 方式 。 

(2) 按 系统 默认 方式 处 理 。 对 于 除数 为 0， 系统 默认 方式 是 终止 该 进程 。 

G) 提供 一 个 函数 ， 信 号 发 生 时 调用 该 函数 ， 这 被 称 为 捕捉 该 信号 。 通 过 提供 自 编 的 函数 ， 
我 们 就 能 知道 什么 时 候 产 生 了 信号 ， 并 按期 望 的 方式 处 理 它 。 


用 户 。 
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很 多 情况 都 会 产生 信和 号。 终端 键盘 上 有 两 种 产生 信和 号 的 方法 ， 分 别称 为 中 断 键 Cinterrupt key, 
通常 是 Delete 键 或 Ctrl+C) 和 退出 键 (quitkey， 通 常 是 CtrlHN)， 它 们 被 用 于 中 断 当前 运行 的 进程 。 
男 一 种 产生 信号 的 方法 是 调用 kill 函数 。 在 一 个 进程 中 调用 此 函数 就 可 向 另 一 个 进程 发 送 一 个 信 
号 。 当 然 这 样 做 也 有 些 限 制 : 当 向 一 个 进程 发 送信 号 时 ， 我 们 必须 是 那个 进程 的 所 有 者 或 者 是 超级 


各 实例 
回忆 一 下 基本 的 shell Scb] ORIS 1-7 程序 )。 如 果 调 用 此 程序 ， 然 后 按 下 中 断 键 ， 则 执行 此 
程序 的 进程 终止 。 产 生 这 种 后 果 的 原因 是 ， 对 于 此 信号 (SIGINT) 的 系统 默认 动作 是 终止 进程 。 


该 进程 没有 告 1 


+ static void sig int(int); /* our signal-catching function */ 


+ 


系统 内 核 应 该 如 何 处 理 此 信号 ， 所 以 系统 按 默认 方式 终止 该 进程 。 


为 了 能 捕捉 到 此 信号 , 程序 需要 调用 signal 函数 ,其 中 指定 了 当 产 生 SIGINT 信和 号 时 
要 调用 的 函数 的 名 字 。 函 数 名 为 sig_int， 当 其 被 调用 时 ， 只 是 打印 一 条 消息 ， 然 后 打印 
一 个 新 提示 符 。 在 图 1-7 程序 中 添加 了 11 行 ， 构 成 了 图 1-10 程序 (添加 的 11 行 以 行 首 的 + 
号 指示 )。 


#include "apue.h" 
#include <sys/wait.h> 


int 


main (void) 


{ 


char buf[MAXLINE]; /* from apue.h */ 
pid t pid; 

int status; 

if (signal(SIGINT, sig int) -- SIG ERR) 


printf("$9£ "); /* print prompt (printf requires $$ to print %) */ 
while (fgets(buf, MAXLINE, stdin) != NULL) { 
if (buf[strlen(buf) - 1] == '\n') 
buf[strlen(buf) - 1] = 0; /* replace newline with null */ 


} 


exit 


err sys("signal error"); 


if ((pid = fork()) « 0) ( 
err sys("fork error"); 

) else if (pid == 0) { /* child */ 
execlp(buf, buf, (char *)0); 


err ret("couldn't execute: $s", buf); 


exit(127); 
} 


/* parent */ 

if ((pid = waitpid(pid, &status, 0)) < 0) 
err sys("waitpid error"); 

printf£("%% "); 


(0); 
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void 
sig int(int signo) 
{ 
printf ("interrupt\n%% "); 


二 十 十 十 十 十 


} 
图 1-10 ”从 标准 输入 读 命令 并 执行 
因为 大 多 数 重要 的 应 用 程序 都 对 信号 进行 处 理 ， 所 以 第 10 章 将 详细 介绍 信号 。 " 


1.10 ”时 间 值 


历史 上 ，UNIX 系统 使 用 过 两 种 不 同 的 时 间 值 。 

(1) 日 历时 间 。 该 值 是 自 协调 世界 时 〈Coordinated Universal Time, UTC) 1970 年 1 月 1 日 
00:00:00 这 个 特定 时 间 以 来 所 经 过 的 秒 数 累计 值 ( 早 期 的 手册 称 UTC 为 格林 尼 治 标准 时 间 )。 这 
些 时 间 值 可 用 于 记录 文件 最 近 一 次 的 修改 时 间 等 。 

系统 基本 数据 类 型 time_t 用 于 保存 这 种 时 间 值 。 

(2) 进程 时 间 。 也 被 称 为 CPU 时 间 ， 用 以 度量 进程 使 用 的 中 央 处 理 器 资源 。 进 程 时 间 以 时 钟 
滴答 计算 。 每 秒 钟 曾经 取 为 50、60 或 100 个 时 钟 滴答 。 

系统 基本 数据 类 型 clock c 保存 这 种 时 间 值 。2.5.4 节 将 说 明 如 何 用 sysconf 函数 得 到 每 
秒 的 时 钟 滴答 数 。 

当 度 量 一 个 进程 的 执行 时 间 时 ( 见 3.9 节 )，UNIX 系统 为 一 个 进程 维护 了 3 个 进程 时 间 值 : 

。 时 钟 时 间 ; 

e 用 户 CPU 时 间 ; 

。 系统 CPU 时 间 。 

时 钟 时 间 又 称 为 墙 上 时 钟 时 间 (wall clock time)， 它 是 进程 运行 的 时 间 总 量 ， 其 值 与 系统 
中 同时 运行 的 进程 数 有 关 。 每 当 在 本 书 中 提 到 时 钟 时 间 时 ， 都 是 在 系统 中 没有 其 他 活动 时 进行 
度量 的 。 

用 户 CPU 时 间 是 执行 用 户 指令 所 用 的 时 间 量 。 系 统 CPU 时 间 是 为 该 进程 执行 内 核 程序 所 经 
历 的 时 间 。 例 如 ， 每 当 一 个 进程 执行 一 个 系统 服务 时 ， 如 read 或 write， 在 内 核 内 执行 该 服务 
所 花费 的 时 间 就 计 入 该 进程 的 系统 CPU 时 间 。 用 户 CPU 时 间 和 系统 CPU 时 间 之 和 常 被 称 为 CPU 
时 间 。 

要 取得 任 一 进程 的 时 钟 时 间 、 用 户 时 间 和 系统 时 间 是 很 容易 的 一 一 只 要 执行 命令 time(1)， 
其 参数 是 要 度量 其 执行 时 间 的 命令 ， 例 如 : 


$ cd /usr/include 
$ time -p grep _POSIX SOURCE */*.h > /dev/null 


real om0.81s 
user om0.11s 
sys om0.07s 


time 命令 的 输出 格式 与 所 使 用 的 shell 有 关 ， 其 原因 是 某 些 shell 并 不 运行 /usz/bin/time， 而 
是 使 用 一 个 内 置 函 数 测量 命令 运行 所 使 用 的 时 间 。 
8.17 节 将 说 明 一 个 运行 进程 如 何 取 得 这 3 个 时 间 。 关 于 时 间 和 日 期 的 一 般 说 明 见 6.10 节 。 
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1.11 系统 调用 和 库 函 数 


所 有 的 操作 系统 都 提供 多 种 服务 的 入 口 点 ， 由 此 程序 向 内 核 请 求 服 务 。 各 种 版 本 的 UNIX 实 
现 都 提供 良好 定义 、 数 量 有 限 、 直接 进入 内 核 的 入 口 点 , 这 些 入 口 点 被 称 为 系统 调用 (system call, 
见 图 1-1)。Research UNIX 系统 第 7 版 提供 了 约 50 个 系统 调用 ，4.4BSD 提供 了 约 110 个 系统 调 
用 ， 而 SVR4 则 提供 了 约 120 个 系统 调用 。 具 体 数字 在 不 同 操作 系统 版 本 中 会 不 同 ， 新 近 的 大 多 
数 系统 大 大 增加 了 支持 的 系统 调用 的 个 数 。Linux 3.2.0 提供 了 380 个 系统 调用 , FreeBSD 8.0 提供 
的 系统 调用 超过 450 个 。 

系统 调用 接口 总 是 在 《UNIX 程序 员 手册 》 的 第 2 部 分 中 说 明 ， 是 用 C 语言 定义 的 ， 与 具体 
系统 如 何 调用 一 个 系统 调用 的 实现 技术 无 关 。 这 与 很 多 早期 的 操作 系统 不 同 ， 那 些 系 统 按 传 统 方 
式 用 机 器 的 汇编 语言 定义 内 核 入 口 点 。 

UNIX 所 使 用 的 技术 是 为 每 个 系统 调用 在 标准 C 库 中 设置 一 个 具有 同样 名 字 的 函数 。 用 户 进 
程 用 标准 C 调用 序列 来 调用 这 些 函 数 ， 然 后 ， 函 数 又 用 系统 所 要 求 的 技术 调用 相应 的 内 核 服 务 。 
例如 ， 函 数 可 将 一 个 或 多 个 C 参数 送 入 通用 寄存 器 ， 然 后 执行 某 个 产生 软 中 断 进 入 内 核 的 机 器 指 
令 。 从 应 用 角度 考虑 ， 可 将 系统 调用 视 为 C 函数 。 

《UNIX 程序 员 手 册 》 的 第 3 部 分 定义 了 程序 员 可 以 使 用 的 通用 库 函 数 。 虽 然 这 些 函数 可 能 会 
调用 一 个 或 多 个 内 核 的 系统 调用 ， 但 是 它们 并 不 是 内 核 的 入 口 点 。 例 如 ，printf 函数 会 调用 
write 系统 调用 以 输出 一 个 字符 串 ， 但 函数 strcpy〔 复 制 一 个 字符 串 ) 和 atoi (将 ASCI 转 
换 为 整数 ) 并 不 使 用 任何 内 核 的 系统 调用 。 

从 实现 者 的 角度 来 看 ， 系 统 调用 和 库 函 数 之 间 有 根本 的 区 别 ， 但 从 用 户 角度 来 看 ， 其 区 别 并 
不 重要 。 在 本 书 中 ， 系 统 调用 和 库 函 数 都 以 C 函数 的 形式 出 现 ， 两 者 都 为 应 用 程序 提供 服务 。 但 
是 ， 我 们 应 当 理 解 ， 如 果 希 望 的 话 ， 我 们 可 以 替换 库 函 数 ， 但 是 系统 调用 通常 是 不 能 被 替换 的 。 

以 存储 空间 分 配 函 数 malloc 为 例 。 有 多 种 方法 可 以 进行 存储 空间 分 配 及 与 其 相关 的 无 用 空 
间 回 收 操作 (最 佳 适 应 、 首 次 适应 等 )， 并 不 存在 对 所 有 程序 都 最 优 的 一 种 技术 。UNIX 系统 调用 
中 处 理 存储 空间 分 配 的 是 sprk(2)， 它 不 是 一 个 通用 的 存储 器 管理 器 。 它 按 指 定 字 节 数 增加 或 减 
少 进程 地 址 空间 。 如 何 管理 该 地 址 空间 却 取决 于 进程 。 存 储 空间 分 配 函 数 malloc(3) 实 现 一 种 特 
定 类 型 的 分 配 。 如 果 我 们 不 喜欢 其 操作 方式 ， 则 可 以 定义 自己 的 malloc 函数 ， 它 很 可 能 将 使 用 
sbrk 系统 调用 。 事 实 上 ， 有 很 多 软件 包 ， 它 们 使 用 sbrk 系统 调用 实现 自己 的 存储 空间 分 配 算 
法 。 图 1-11 显示 了 应 用 程序 、malloc 函数 以 及 sbrk 系统 调用 之 间 的 关系 。 

从 中 可 见 ， 两 者 职责 不 同 ， 内 核 中 的 系统 调用 分 配 一 块 空间 给 进程 ， 而 库 函 数 malloc 则 在 
用 户 层次 管理 这 一 空间 。 

另 一 个 可 说 明 系统 调用 和 库 函 数 之 间 差 别 的 例子 是 ，UNIX 系统 提供 的 判断 当前 时 间 和 日 期 
的 接口 。 一 些 操作 系统 分 别提 供 了 一 个 返回 时 间 的 系统 调用 和 另 一 个 返回 日 期 的 系统 调用 。 任 何 
特殊 的 处 理 ， 例 如 正常 时 制 和 夏令 时 之 间 的 转换 ， 由 内 核 处 理 或 要 求人 为 干预 。UNIX 系统 则 不 
同 ， 它 只 提供 一 个 系统 调用 ， 该 系统 调用 返回 自 协 调 世 界 时 1970 年 1 月 1 日 零 时 这 个 特定 时 间 
以 来 所 经 过 的 秒 数 。 对 该 值 的 任何 解释 ， 例 如 将 其 变换 成 人 们 可 读 的、 适用 于 本 地 时 区 的 时 间 和 
日 期 ， 都 留 给 用 户 进程 进行 处 理 。 在 标准 C 库 中 ， 提 供 了 若干 例 程 以 处 理 大 多 数 情况 。 这 些 库 函 
数 处 理 各 种 细节 ， 如 各 种 夏令 时 算法 等 。 

应 用 程序 既 可 以 调用 系统 调用 也 可 以 调用 库 函 数 。 很 多 库 函 数 则 会 调用 系统 调用 。 图 1-12 显 
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图 1-11 malloc 函数 和 sbrk 系统 调用 1-12. C 库 函数 和 系统 调用 之 间 的 差别 
系统 调用 和 库 函 数 之 间 的 另 一 个 差别 是 : 系统 调用 通常 提供 一 种 最 小 接口 ， 而 库 函数 通常 提 
供 比 较 复杂 的 功能 。 我 们 从 sork RAHA malloc 库 函 数 之 间 的 差别 中 可 以 看 到 这 一 点 。 当 
我 们 比较 不 带 缓冲 的 IO 函数 〈 见 第 3 章 ) 和 标准 VO 函数 〈( 见 第 5 章 ) 时 ， 还 将 看 到 这 种 差别 。 
进程 控制 系统 调用 (fork. exec 和 wait) 通常 由 用 户 应 用 程序 直接 调用 (请 回忆 图 1-7 
中 的 基本 shell)。 但 是 为 了 简化 某 些 常见 的 情况 ，UNIX 系统 也 提供 了 一 些 库 函数 ， 如 system 
和 popen。8.13 节 将 说 明 system 函数 的 一 种 实现 ， 它 使 用 基本 的 进程 控制 系统 调用 。10.18 节 
还 将 强化 这 一 实例 以 正确 地 处 理 信和 号。 
为 使 读者 了 解 大 多 数 程序 员 应 用 的 UNIX 系统 接口 ， 我 们 不 得 不 既 说 明 系 统 调用 ， 又 介绍 某 
些 库 函 数 。 例 如 ， 若 只 描述 sork 系统 调用 ， 那么 就 会 忽略 很 多 应 用 程序 使 用 的 malloc FERA. 
本 书 除了 必须 要 区 分 两 者 时 ， 对 系统 调用 和 库 函 数 都 使 用 函数 (function) 这 一 术语 来 表示 。 


1.12 小结 
本 章 快速 浏览 了 UNIX 系统 。 说 明了 某 些 以 后 会 多 次 用 到 的 基本 术语 , 介绍 了 一 些小 的 UNIX 
程序 实例 。 读 者 可 以 从 中 大 概 了 解 到 本 书 其 余部 分 将 要 介绍 的 内 容 。 


下 一 章 是 关于 UNIX 系统 的 标准 ,以 及 这 方面 的 工作 对 当前 系统 的 影响 。 标准 , 特别 是 ISOC 
标准 和 POSIX.1 标准 ， 将 影响 本 书 的 余下 部 分 。 


习题 


L1 ”在 系统 上 验证 ， 除 根 目 录 外 ， 目 录 . 和 . .是 不 同 的 。 
1.2 SAE 1-6 程序 的 输出 ， 说 明 进 程 ID 为 852 和 853 的 进程 发 生 了 什么 情况 ? 


习题 19 





在 1.7 HB, perror 的 参数 是 用 ISOC 的 属性 const 定义 的 ， 而 strerror 的 整 型 参数 
没有 用 此 属性 定义 ， 为 什么 ? 

若 日 历时 间 存 放 在 带 符号 的 32 位 整 型 数 中 ， 那 么 到 哪 一 年 它 将 溢出 ? 可 以 用 什么 方法 扩展 

洲 出 浮 点 数 ? 采用 的 策略 是 否 与 现 有 的 应 用 相 兼 容 ? 

若 进 程 时 间 存 放 在 带 符 号 的 32 位 整 型 数 中 ， 而 且 每 秒 为 100 时 钟 滴答 ， 那 么 经 过 多 少 天 后 

该 时 间 值 将 会 谥 出 ? 


UNIX 标准 及 实现 








2.1 引言 


人 们 在 UNIX 编程 环境 和 C 程序 设计 语言 的 标准 化 方面 已 经 做 了 很 多 工作 。 虽 然 UNIX 应 用 
程序 在 不 同 的 UNIX 操作 系统 版 本 之 间 进 行 移植 相当 容易 ， 但 是 20 世纪 80 年 代 UNIX 版 本 种 类 
的 剧 增 以 及 它们 之 间 差 别 的 扩大 ， 导 致 很 多 大 用 户 〈 如 美国 政府 ) 呼吁 对 其 进行 标准 化 。 

本 章 首 先 回顾 过 去 近 25 年 人 们 在 UNIX 标准 化 方面 做 出 的 种 种 努力 ， 然 后 讨论 这 些 UNIX 
编程 标准 对 本 书 所 列举 的 各 种 UNIX 操作 系统 实现 的 影响 。 所 有 标准 化 工作 的 一 个 重要 部 分 是 对 
每 种 实现 必须 定义 的 各 种 限制 进行 说 明 ， 所 以 我 们 将 说 明 这 些 限 制 以 及 确定 它们 值 的 各 种 方法 。 


2.2 UNIX 标准 化 


2.2.1 ISOC 


1989 年 下 半年 ，C 程序 设计 语言 的 ANSI 标准 X3.159-1989 得 到 批准 。 此 标准 被 也 采纳 为 国 
际 标准 ISO/IEC 9899:1990. ANSI 是 美国 国家 标准 学 会 (American National Standards Institute) 的 
缩写 ， 它 是 国际 标准 化 组 织 〈International Organization for Standardization, ISO) 中 代表 美国 的 成 

hi. IEC 是 国际 电子 技术 委员 会 (International Electrotechnical Commission) 的 缩写 。 

ISO C 标准 现在 由 ISO/AEC 的 C 程 序 设计 语言 国际 标准 工作 组 维护 和 开发 , 该 工作 组 称 为 ISO/ 
IEC JTC1/SC22/WG14, 简称 WG14。ISO C 标准 的 意图 是 提供 C 程序 的 可 移植 性 ， 使 其 能 适合 于 
大 量 不 同 的 操作 系统 ， 而 不 只 是 适合 UNIX 系统 。 此 标准 不 仅 定 义 了 C 程序 设计 语言 的 诸 法 和 语 
义 ， 还 定义 了 其 标准 库 〈 参 见 ISO 1999 第 7 3$; Plauger[1992]: Kernighan 和 Ritchie[1988] 中 的 附 
录 B)。 因 为 所 有 现今 的 UNIX 系统 (如 本 书 介绍 的 几 个 UNIX 系统 ) 都 提供 C 标准 中 定义 的 库 
函数 ， 所 以 该 标准 库 非常 重要 。 

1999 ££, ISO C 标准 被 更 新 ， 并 被 批准 为 ISO/IEC 9899:1999， 它 显著 改善 了 对 进行 数值 处 理 
的 应 用 软件 的 支持 。 除 了 对 某 些 函数 原型 增加 了 关键 字 restrict 外 ,这 种 改变 并 不 影响 本 书 中 
描述 的 POSIX HO. restrict 关键 字 告诉 编译 器 ,哪些 指针 引用 是 可 以 优化 的 ， 其 方法 是 指出 
指针 引用 的 对 象 在 函数 中 只 通过 该 指针 进行 访问 。 

1999 年 以 来 ， 已 经 公布 了 3 个 技术 勘误 来 修正 ISO C 标准 中 的 错误 ， 分 别 在 2001 年 、2004 
年 和 2007 年 公布 。 如 同 大 多 数 标准 一 样 ， 在 批准 标准 和 修改 软件 使 其 符合 标准 两 者 之 间 有 一 段 
时 间 延 迟 。 随 着 供应 商 编译 系统 的 不 断 演化 ， 对 最 新 ISO C 标准 的 支持 也 就 越 来 越 多 。 
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gcc 对 ISO C 标准 1999 版 本 符合 程度 的 总 结 可 参见 http://www.gnu.org/c99status. 
html， 虽 然 C 标准 已 经 在 2011 年 更 新 ， 但 由 于 其 他 标准 还 没有 进行 相应 的 更 新 ， 因 此 在 本 书 中 
我 们 还 是 沿用 1999 年 的 版 本 。 


按照 该 标准 定义 的 各 个 头 文件 〈 见 图 2-1) 可 将 ISO C 库 分 成 24 个 区 。POSIX.1 标准 包括 这 些 
头 文件 以 及 另外 一 些 头 文件 。 从 图 2-1 中 可 以 看 出 , 所 有 这 些 头 文件 在 4 种 UNIX 实现 (FreeBSD 8.0、 
Linux 3.2.0. Mac OS X 10.6.8 和 Solaris 10) 中 都 支持 。 本 章 后 面 将 对 这 4 种 UNIX 实现 进行 说 明 。 


ISO C 头 文件 依赖 于 操作 系统 所 配置 的 C 编译 器 的 版 本 。FreeBSD 8.0 配置 了 gcc 4.2.1 版 ， 
Solaris 10 配置 了 gcc 3.4.3 版 ( 以 及 Sun Studio 自 带 的 C 编译 器 )，Ubuntu 12.04 ( Linux 3.2.0 ) 配 
X f gcc 4.6.3 版 ，Mac OS X 10.6.8 配置 了 gcc 4.0.1 和 4.2.1 版 。 


FreeBSD 8.0 Linux 3.2.0 MacOS X 10.6.8 Solaris 10 








<assert.h> 
<complex.h> 
<ctype.h> 
<errno.h> 
«fenv.h» 
«float.h» 
«inttypes.h» 
«iso646.h» 
<limits.h> 
<locale.h> 
<math.h> 
«setjmp.h» 
«signal.h» 
<stdarg.h> 
«stdbool.h» 
«stddef.h» 
<stdint.h> 
<stdio.h> 
<stdlib.h> 
<string.h> 
«tgmath.h» 
«time.h» 
«wchar.h» 


«wctype.h» 


图 2-1 


ISO C 标准 定义 的 头 文件 


验证 程序 断言 
复数 算术 运算 支持 
字符 分 类 和 映射 支持 

出 错 码 (1.7 节 ) 

浮 点 环境 

浮 点 常量 及 特性 
整 型 格式 变换 

赋值 、 关 系 及 一 元 操作 符 宏 
实现 常量 (2.5 节 ) 

本 地 化 类 别 及 相关 定义 
数学 函数 、 类 型 声明 及 常量 
非 局 部 goto (7.10 节 ) 
信号 〈 第 10 章 ) 

可 变 长 度 参数 表 
布尔 类 型 和 值 

标准 定义 

og 

标准 1O 库 (第 5 章 ) 
实用 函数 

字符 串 操作 
通用 类 型 数学 宏 
时 间 和 日 期 (6.10 节 ) 
扩充 的 多 字 节 和 宽 字 符 支 持 
宽 字 符 分 类 和 映射 支持 





2.2.2 IEEE POSIX 


POSIX 是 一 个 最 初 由 IEEE (institute of Electrical and Electronics Engineers， 电 气 和 电子 工程 
师 学 会 ) 制订 的 标准 族 。POSIX 指 的 是 可 移植 操作 系统 接口 (Portable Operating System Interface). 
它 原来 指 的 只 是 IEEE 标准 1003.1-1988《〔〈 操 作 系统 接口 )， 后 来 则 扩展 成 包括 很 多 标记 为 1003 的 
标准 及 标准 草案 ， 如 shell 和 实用 程序 (1003.2). 

与 本 书 相关 的 是 1003.1 操作 系统 接口 标准 , 该 标准 的 目的 是 提升 应 用 程序 在 各 种 UNIX 系统 
环境 之 间 的 可 移植 性 。 它 定义 了 “符合 POSIX 的 ” (POSIX compliant) 操作 系统 必须 提供 的 各 
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种 服务 。 该 标准 已 被 很 多 计算 机 制造 商 采 用 。 虽 然 1003.1 标准 是 以 UNIX 操作 系统 为 基础 的 ， 但 
是 它 并 不 限于 UNIX 和 UNIX 类 的 系统 。 确 实 ， 有 些 提供 专 有 操作 系统 的 制造 商 也 声称 他 们 的 系 
统 符合 POSIX( 同 时 还 保留 所 有 专 有 功能 )。 

由 于 1003.1 标准 说 明了 一 个 接口 (interface) 而 不 是 一 种 实现 (implementation)， 所 以 并 不 
区 分 系统 调用 和 库 函 数 。 所 有 在 标准 中 的 例 程 都 被 称 为 函数 。 

标准 是 不 断 演 进 的 ，1003.1 标准 也 不 例外 。 该 标准 的 1988 版 ， 即 IEEE 标准 1003.1-1988 经 
修改 后 递交 给 ISO， 它 没有 增加 新 的 接口 或 功能 ， 但 修订 了 文本 。 最 终 的 文档 作为 IEEE 标准 
1003.1-1990 正式 出 版 [IEEE 1990]， 这 也 就 是 国际 标准 ISO/IEC 9945-1:1990。 该 标准 通常 称 为 
POSIX.1， 本 书 将 使 用 此 术语 来 表示 不 同 版 本 的 标准 。 

IEEE 1003.1 工作 组 此 后 继续 对 这 一 标准 做 了 更 多 修改 。1996 年 ， 该 标准 的 修订 版 发 布 ， 它 
包括 了 1003.1-1990、1003.1b-1993 实时 扩展 标准 以 及 被 称 为 pthreads 的 和 多 线程 编程 接口 (POSIX 
AED, 这 就 是 国际 标准 ISO/IEC 9945-1:1996。1999 年 出 版 了 IEEE 标准 1003.1d-1999， 其 中 增加 
了 更 多 实时 接口 。 一 年 后 ， 出 版 了 IEEE 标准 1003.1j-2000 和 1003.1q-2000， 前 者 包含 了 更 多 实时 
接口 ， 后 者 增加 了 标准 在 事件 跟踪 方面 的 扩展 。 

2001 年 的 1003.1 版 本 与 以 前 各 版 本 有 较 大 的 差别 ， 它 组 合 了 多 个 1003.1 的 修正 、1003.2 标 
准 以 及 Single UNIX Specificaiton (SUS) 第 2 版 的 若干 部 分 〈 对 于 SUS， 后 面 将 进行 更 多 说 明 )， 
这 形成 了 IEEE 标准 1003.1-2001， 它 包括 下 列 几 个 标准 。 

e ISO/IEC 9945-1 (IEEE 标准 1003.1-1996)， 包 括 

+ IEEE 标准 1003.1-1990 

€ IEEE 标准 1003.1b-1993( 实 时 扩展 ) 

€ IEEE 标准 1003.1c-1995 (pthreads) 

@ IEEE 标准 1003.1i-1995 (实时 技术 勘误 表 ) 

e IEEE P1003.1a 草案 (系统 接口 修正 》 

e IEEE 标准 1003.1d-1999 (高 级 实时 扩展 ) 

e IEEE 标准 1003.1j-2000 (更 多 高 级 实时 扩展 ) 

e IEEE 标准 1003.1q-2000 (ERER) 

e 部 分 IEEE 标准 1003.1g-2000 (协议 无 关 接 口 ) 

e ISO/IEC 9945-2 (IEEE 标准 1003.2-1993) 

e IEEE P1003.2b 草案 (shell 及 实用 程序 的 修正 ) 

e IEEE 标准 1003.2d-1994〔 批 处 理 扩展 ) 

e Single UNIX Specification 第 2 版 基本 说 明 ， 包 括 

e 系统 接口 定义 ， 第 5 发 行 版 
e 命令 和 实用 程序 ， 第 5 发 行 版 
e 系统 接口 和 头 文件 ， 第 5 发 行 版 

。 开放 组 技术 标准 ， 网 络 服务 ，5.2 发 行 版 

e ISO/IEC 9899-1999，C 程序 设计 语言 

2004 年 , POSIX.1 说 明 随 着 技术 勘误 得 到 更 新 , 2008 年 做 了 更 多 综合 的 改动 并 作为 基本 说 明 
的 第 7 发 行 版 发 布 ，ISO 在 2008 年 底 批 准 了 这 个 版 本 并 在 2009 年 进行 发 布 ， 即 国际 标准 
ISO/IEC9945:2009。 该 标准 基于 其 他 儿 个 标准 。 

e IEEE 标准 1003.1, 2004 年 版 。 





。 开放 组 织 技术 标准 ，2006， 扩 展 API 集 ， 第 1 一 4 部 分 。 

e ISO/IEC 9899:1999， 包 含 勘误 表 。 

图 2-2、 图 2-3 以 及 图 2-4 总 结 了 POSIX.1 指定 的 必需 的 和 可 选 的 头 文件 。 因 为 POSIX.1 包 
A f ISO C 标准 库 函 数 ， 所 以 它 还 需要 图 2-1 中 列 出 的 各 个 头 文件 。 这 4 张 图 中 的 表 也 总 结 了 本 
书 所 讨论 的 4 种 UNIX 系统 实现 所 包含 的 头 文件 。 


<aio.h> 
<cpio.h> 
«dirent.h» 
«dlfcn.h» 
«fcntl.h» 
<fnmatch.h> 
<glob.h> 
<grp.h> 
<iconv.h> 
<langinfo.h> 
<monetary.h> 
<netdb.h> 
<nl_types.h> 
<poll.h> 
<pthread.h> 
<pwd.h> 
<regex.h> 
<sched.h> 
<semaphore.h> 
<strings.h> 
<tar.h> 
<termios.h> 
<unistd.h> 
<wordexp.h> 
<arpa/inet.h> 
<net/if.h> 
<netinet/in.h> 
<netinet/tcp.h> 
<sys/mman.h> 
<sys/select.h> 
<sys/socket.h> 
«sys/stat.h» 
<sys/statvfs.h> 
<sys/times.h> 
<sys/types.h> 


<sys/un.h> 


<sys/utsname.h> 
<sys/wait.h> 


FreeBSD Linux 
8.0 3.2.0 


Mac OS X 
10.6.8 








图 2-2 POSIX 标准 定义 的 必需 的 头 文件 
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异步 IO 

cpio 归档 值 

目录 项 (4.22 节 ) 

动态 链接 

文件 控制 (3.14 节 ) 
文件 名 匹配 类 型 

路 径 名 模式 匹配 与 生成 
组 文件 (6.4 节 ) 
代码 集 变 换 实用 程序 

语言 信息 常量 
货币 类 型 与 函数 

网 络 数据 库 操作 

消息 类 

投票 函数 (14.4.2 节 ) 
线程 〈 第 11 章 、 第 12 章 ) 
口令 文件 (6.2 节 ) 

正则 表达 式 

执行 调度 

信号 量 

字符 串 操 作 

tar 归档 值 

终端 IO (第 18 章 ) 

符号 常量 

字 扩 充 类 型 

因特网 定义 〈 第 16 章 ) 

套 接 字 本 地 接口 (第 16 章 ) 
因特网 地 址 族 (16.3 节 ) 
传输 控制 协议 定义 

存储 管理 声明 

select MM (14.4.1 节 ) 
套 接 字 接 口 (第 16 章 ) 
文件 状态 (第 4 章 ) 

文件 系统 信息 

进程 时 间 (8.17 节 ) 

基本 系统 数据 类 型 (2.8 节 ) 
UNIX 域 套 接 字 定义 (17.2 节 ) 
系统 名 (6.9 节 ) 

进程 控制 (8.6 节 ) 


本 书 中 描述 了 POSIX.1 2008 年 版 ， 其 接口 分 成 两 部 分 : 必需 部 分 和 可 选 部 分 。 可 选 接口 部 分 
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按 功 能 又 进一步 分 成 40 个 功能 分 区 。 图 2-5 按 各 自 的 选项 码 总 结 了 包含 未 弃 用 的 编程 接口 。 选 项 
码 是 能 够 表述 标准 的 2 一 3 个 字母 的 缩写 ， 用 以 标识 属于 各 个 功能 分 区 的 接口 ， 其 中 的 接口 依赖 
于 特定 选项 的 支持 。 很 多 选项 处 理 实时 扩展 。 


FreeBSD Linux Mac OS X 


Solaris 10 


<fmtmsg.h> 
<ftw.h> 
<libgen.h> 
<ndbm. h> 
<search.h> 


<syslog.h> 


<utmpx.h> 


8.0 3.2.0 10.6.8 





<sys/ipc.h> 
<sys/msg.h> 
<sys/resource.h> 
<sys/sem.h> 
<sys/shm.h> 
<sys/time.h> 
<sys/uio.h> 






SUS 强制 的 
ADV 


头 文件 








消息 显示 结构 
文件 树 漫游 (4.22 节 ) 
路 径 名 管理 函数 
数据 库 操作 

搜索 表 

系统 出 错 日 志 记 录 (13.4 节 ) 
用 户 账 户 数据 库 

IPC (15.6 节 ) 

XSI 消息 队列 (15.7 节 ) 
资源 操作 〈7.11 节 ) 
XSI 信号 量 (15.8 节 ) 
XSI 共享 存储 C15.9 节 ) 
时 间 类 型 

矢量 VO 操作 (14.6 节 ) 


图 2-3 POSIX 标准 定义 的 XSI 可 选 头 文件 






Mac OS X 
10.6.8 


Linux 
32.0 





«mqueue.h» 消息 队列 
<spawn.h> 实时 spawn 接口 








图 2-4 POSIX 标准 定义 的 可 选 头 文件 


_POSIX_ADVISORY_INFO 
.POSIX CPUTIME 

.POSIX FSYNC 

.POSIX IPV6 

.POSIX MEMLOCK 

.POSIX MEMLOCK RANGE 
POSIX MONOTONIC CLOCK 
POSIX MESSAGE PASSING 


JSTDC IEC 559 _ 


.POSIX PRIORITIZED IO 

POSIX PRIORITIZED SCHEDULING 
POSIX THREAD ROBUST PRIO INHERIT 
POSIX THREAD ROBUST PRIO PROTECT 
.POSIX RAW SOCKETS 

.POSIX SHARED MEMORY OBJECTS 
.POSIX SYNCHRONIZED IO 

.POSIX SPAWN 

.POSIX SPORADIC SERVER 

.POSIX THREAD CPUTIME 





建议 性 信息 〈 实 时) 

进程 CPU 时 间 时 钟 ( 实 时) 
文件 同步 

IPv6 接口 

进程 存储 区 加 锁 〈 实 时 ) 

存储 区 域 加 锁 〈 实 时 》 
单调 时 钟 ( 实 时 ) 

消息 传送 (实时 ) 

IEC 60559 浮 点 选项 

优先 输入 和 输出 

进程 调度 (实时 ) 

健壮 的 互 斥 量 优 先 权 继 承 〔 实 时 ) 
健壮 的 互 斥 量 优先 权 保 护 〈 实 时 ) 
原始 套 接 字 

共享 存储 对 象 〈 实 时 ) 

同步 输入 和 输出 (实时 ) 
FE 

进程 阵 发 性 服务 器 〈 实 时 ) 
线程 CPU 时 间 时 钟 ( 实 时) 
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_POSIX_THREAD_PRIO_INHERIT 非 键 壮 的 互 斥 量 优先 权 继承 《〈 实 时) 
_POSIX_THREAD_PRIO_PROTECT 非 键 壮 的 互 斥 量 优先 权 保 护 〈 实 时 ) 
_POSIX_THREAD_PRIORITY_SCHEDULING | 线程 执行 调度 实时 》 
_POSIX_THREAD_ATTR_STACKADDR 线程 栈 地 址 属性 

POSIX THREAD PROCESS SHARED 线程 进程 共享 同步 


POSIX THREAD SPORADIC SERVER 线程 阵 发 性 服务 器 〈 实 时 ) 
POSIX THREAD ATTR STACKSIZE 线程 栈 长 度 属 性 

POSIX TYPED MEMORY OBJECTS 类 型 存储 对 象 〈 实 时 ) 
_XOPEN_UNIX X/Open 扩充 接口 


图 2-5 POSIX.1 可 选 接口 组 和 选项 码 





POSIX.1 没有 包括 超级 用 户 (superuser) 这 样 的 概念 ， 代 之 以 规定 某 些 操作 要 求 “ 适 当 的 优 
先 权 ”，POSIX.1 将 此 术语 的 含义 留 由 具体 实现 进行 解释 。 某 些 符合 美国 国防 部 安全 性 指南 要 求 的 
UNIX 系统 具有 很 多 不 同 的 安全 级 。 本 书 仍 使 用 传统 的 UNIX 术语 ， 并 指明 要 求 超级 用 户 特 权 的 
操作 。 

经 过 20 多 年 的 工作 , 相关 标准 已 经 成 熟 稳定 。 POSIX.1 标准 现在 由 Austin Group 开放 工作 组 
(http://www.opengroup.org/austin) 维护 。 为 了 保证 它们 仍然 有 价值 ， 仍 需 经 常 对 这 些 
标准 进行 更 新 或 再 确认 。 


2.2.3 Single UNIX Specification 


Single UNIX Specification (SUS， 单 一 UNIX 规范 ) 是 POSIX.1 标准 的 一 个 超 集 ， 它 定义 了 
一 些 附加 接口 扩展 了 POSIX.1 规范 提供 的 功能 ,. POSIX.1 相当 于 Single UNIX Specification 中 的 基 
本 规范 部 分 。 

POSIX.1 中 的 X/Open 系统 接口 (X/Open System Interface, XSI) 选项 描述 了 可 选 的 接口 ， 
也 定义 了 遵循 XSI (XSI conforming) 的 实现 必须 支持 POSIX.1 的 哪些 可 选 部 分 。 这 些 必须 支 
持 的 部 分 包括 : 文件 同步 、 线 程 栈 地 址 和 长 度 属性 、 线 程 进程 共享 同步 以 及 _XOPEN_UNIX ff 
写 常量 (在 图 2-5 中 它们 被 加 上 “SUS 强制 的 ”的 标记 )。 只 有 遵循 XSI 的 实现 才能 称 为 UNIX 
Open Group 拥有 UNIX 商标 , 他 们 使 用 Single UNIX Specification 定义 了 一 系列 接口 。 一 个 系 
统 要 想 称 为 UNIX 系统 ， 其 实现 必须 支持 这 些 接口 。UNIX 系统 供应 商 必 须 以 文件 形式 提供 符合 

性 声明 ， 并 通过 验证 符合 性 的 测试 ， 才 能 得 到 使 用 UNIX 商标 的 许可 证 。 


有 些 接口 在 遵循 XSI 的 系统 中 是 可 选 的 ， 这 些 接 口 根据 功能 被 分 成 若干 选项 组 (option 
group), HAKU Fo 

e 加 密 : 由 符号 常量 XOPEN_CRYPE 标记 。 

e 实时 : 由 符号 常量 XOPEN REALTIME 标记 。 

。 高 级 实时 。 

。 实时 线程 : 由 符号 常量 XOPEN _REALTIME_THREADS 标记 。 

。 高 级 实时 线程 。 

Single UNIX Specification 是 Open Group 的 出 版 物 ， 而 Open Group 是 由 两 个 工业 社团 
X/Open 和 开放 系统 软件 基金 会 (Open System Software Foundation, OSF) 在 1996 年 合并 构成 
的 。X/Open 过 去 出 版 了 X/Open Portability Guide (X/Open 可 移植 性 指南 )， 它 采用 了 若干 特定 
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标准 ， 填 补 了 其 他 标准 缺失 功能 的 空白 。 这 些 指南 的 目的 是 改善 应 用 的 可 移植 性 ， 使 其 不 仅仅 
符合 已 发 布 的 标准 。 

X/Open 在 1994 年 发 布 了 Single UNIX Specification 第 1 版 , 因为 它 大 约 包含 了 1170 个 接口 ， 
因此 也 称 为 “Spec 1170”。 它 源 自 通用 开放 软件 环境 (Common Open Software Environment, 
COSE) 的 倡议 ， 该 倡议 的 目标 是 进一步 改善 应 用 程序 在 所 有 UNIX 操作 系统 实现 之 间 的 可 移植 
YE. COSE 的 成 员 包 括 Sun. IBM, HP. Novell/USL 以 及 OSF 等 ， 他 们 的 UNIX 都 包含 了 通用 商 
业 化 应 用 软件 使 用 的 接口 ， 这 较 之 仅仅 赞同 和 支持 标准 前 进 了 一 大 步 。 从 这 些 应 用 软件 的 接口 中 
选 出 的 1170 个 接口 被 包括 在 下 列 标准 中 : X/Open 通用 应 用 环境 (Common Application 
Environment, CAE) 第 4 发 行 版 (也 被 称 为 XPG4， 以 表示 它 与 其 前 身 X/Open Portability Guide 
的 历史 关系 )、 系 统 V 接口 定义 (System V Interface Definition, SVID) 第 3 版 Level 1 接口 、OSF 
应 用 环境 规范 (Application Environment Specification，AES) Full Use 接口 。 

1997 年 ，Open Group 发 布 了 Single UNIX Specification 第 2 版。 新 版 本 增加 了 对 线程 、 实 时 
接口 、64 位 处 理 、 大 文件 以 及 增强 的 多 字 节 字符 处 理 等 功能 的 支持 。 

Single UNIX Specification 第 3 版 (SUSv3) 由 Open Group 在 2001 年 发 布 。SUSv3 的 基本 规 
范 与 IEEE 标准 1003.1-2001 相同 ， 分 成 4 个 部 分 : 基本 定义 、 系 统 接口 、shell 和 实用 程序 以 及 基 
本 理论 。SUSv3 还 包括 X/Open Curses 第 4 发 行 版 第 2 版 , 但 该 规范 并 不 是 POSIX.1 的 组 成 部 分 。 

2002 年 ，ISO 将 IEEE 标准 1003.1-2001 批准 为 国际 标准 ISO/IEC 9945:2002. Open Group 在 
2003 年 再 次 更 新 了 1003.1 标准 ， 包 括 了 技术 方面 的 更 正 。ISO 将 其 批准 为 国际 标准 ISO/IEC 
9945:2003。2004 年 4 月 ，Open Group 发 布 了 Single UNIX Specification 第 3 版 2004 年 版 ， 将 更 
多 技术 上 的 更 正 合并 到 标准 的 正文 中 。 

2008 年 ，Single UNIX Specification 再 次 更 新 , 包括 了 更 正和 新 的 接口 、 移 除 弃 用 的 接口 以 及 将 

- 些 未 来 可 能 被 删除 的 接口 标记 为 弃 用 接口 等 。 另外 , 有 一 些 过 去 被 认为 可 选 的 接口 变 成 必 选 接口 ， 
其 中 包括 异步 W/O、 屏障 、 时 钟 选择 、 存 储 映像 文件 、 内 存 保护 、 读 写 锁 、 实 时 信号 、POSIX 信号 
量 、 旋 转 锁 、 线 程 安全 函数 、 线 程 、 超 时 机 制 以 及 时 钟 等 。 最 终 形成 的 标准 就 是 基本 规范 的 第 7 发 
行 版 , 也 即 POSIX.1-2008. Open Group 把 这 个 版 本 和 X/OPEN Curses 规范 的 更 新 版 打包 , 并 于 2010 
年 作为 Single UNIX Specification 第 4 版 发 布 。 我 们 把 这 个 规范 称 为 SUSv4。 


2.2.4 FIPS 


FIPS 代表 的 是 联邦 信息 处 理 标准 (Federal Information Processing Standard)， 这 一 标准 是 由 美 
国政 府 发 布 的 ， 并 由 美国 政府 用 于 计算 机 系统 的 采购 。FIPS151-1 (1989 年 4 月 ) 基于 IEEE 标准 
1003.1-1988 及 ANSI C 标准 草案 。 此 后 是 FIPS 151-2(1993 年 5 月 ), 它 基于 IEEE 标准 1003.1-1990。 
在 POSIX.1 中 列 为 可 选 的 某 些 功能 ,在 FIPS 151-2 中 是 必需 的 .所 有 这 些 可 选 功能 在 POSIX.1-2001 
中 已 成 为 强制 性 要 求 。 

POSIX.1 FIPS 的 作用 是 , 它 要 求 任何 希望 向 美国 政府 销售 符合 POSIX.1 标准 的 计算 机 系统 的 
厂商 都 应 支持 POSIX.1 的 某 些 可 选 功 能 。 因 为 POSIX.1 FIPS 已 经 撤回 ， 所 以 在 本 书 中 我 们 不 再 
进一步 考虑 它 。 


2.3 UNIX 系统 实现 


上 一 节 说 明了 3 个 由 各 自 独立 的 组 织 所 制定 的 标准 : ISO C. IEEE POSIX 以 及 Single UNIX 
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Specification。 但 是 ， 标 准 只 是 接口 的 规范 。 这 些 标准 是 如 何 与 现实 世界 相关 连 的 呢 ? 这 些 标 准 
由 厂商 采用 ， 然 后 转变 成 具体 实现 。 本 书 中 我 们 不 仅 对 这 些 标 准 感 兴趣 ， 还 对 它们 的 具体 实现 
感 兴趣 。 

在 McKusick 等 [1996] 的 1.1 节 中 给 出 了 UNIX 系统 家 族 树 的 详细 历史 。UNIX 的 各 种 版 本 和 
变 体 都 起 源 于 在 PDP-11 系统 上 运行 的 UNIX 分 时 系统 第 6 版 (1976 年 ) 和 第 7 版 (1979 Æ) GÑ 
常 称 为 V6 和 V7)。 这 两 个 版 本 是 在 贝尔 实验 室 以 外 首先 得 到 广泛 应 用 的 UNIX 系统 。 从 这 棵 树 
上 演进 出 以 下 3 个 分 支 。 

(1) AT&T 分 支 ， 从 此 引出 了 系统 MARA V ERRA UNIX 的 商用 版 本 )。 

(2) 加 州 大 学 伯克利 分 校 分 支 ， 从 此 引出 4.xBSD 实现 。 

(3) 由 AT&T 贝尔 实验 室 的 计算 科学 研究 中 心 不 断 开发 的 UNIX 研究 版 本 ， 从 此 引出 UNIX 
分 时 系统 第 8 版 、 第 9 版 ， 终 止 于 1990 年 的 第 10 版 。 


2.3.1 SVR4 


SVR4 (UNIX System V Release 4) 是 AT&T 的 UNIX 系统 实验 室 (UNIX System Laboratories， 
USL， 其 前 身 是 AT&T 的 UNIX Software Operation) 的 产品 ， 它 将 下 列 系统 的 功能 合并 到 了 一 个 
一 致 的 操作 系统 中 : AT&T UNIX 系统 V 3.2 版 (SVR3.2)、Sun Microsystems 公司 的 SunOS 操作 
系统 、 加 州 大 学 伯克利 分 校 的 4.3BSD 以 及 微软 的 Xenix 系统 (Xenix 是 在 V7 的 基础 上 开发 的 ， 
后 来 又 采纳 了 很 多 系统 V 的 功能 )。 其 源 代 码 于 1989 年 后 期 发 布 ， 在 1990 年 开始 向 终端 用 户 提 
供 。SVR4 符合 POSIX 1003.1 标准 和 X/Open XPG3 标准 。 

AT&T 也 出 版 了 系统 V 接口 定义 (SVID) [AT&T 1989]. SVID 第 3 版 说 明了 UNIX 系统 要 
达到 SVR4 质量 要 求 必须 提供 的 功能 。 如 同 POSIX.1 一 样 ，SVID 定义 了 一 个 接口 ， 而 不 是 一 种 
实现 。SVID 并 不 区 分 系统 调用 和 库 函 数 。 对 于 一 个 SVR4 的 具体 实现 ， 应 查看 其 参考 手册 ， 以 
了 解 系统 调用 和 库 函 数 的 不 同 之 处 [AT&T 1990e]。 


2.3.2 4.4BSD 


BSD (Berkeley Software Distribution) 是 由 加 州 大 学 伯克利 分 校 的 计算 机 系统 研究 组 (CSRG) UE 
究 开发 和 分 发 的 。4.2BSD 于 1983 年 问世 ，4.3BSD 则 于 1986 年 发 布 。 这 两 个 版 本 都 在 VAX 小 型 机 
上 运行 。 它 们 的 下 一 个 版 本 4.3BSD Tahoe 于 1988 年 发 布 ， 在 一 台 称 为 Tahoe 的 小 型 机 上 运行 (Leffler 
等 [1989] 说 明了 4.3BSD Tahoe 版 )。 其 后 又 有 1990 年 的 4.3BSD Reno 版 ， 它 支持 很 多 POSIX.1 的 功能 。 

最 初 的 BSD 系统 包含 了 AT&T 专 有 的 源 代 码 ， 它 们 需要 AT&T 许可 证 。 为 了 获得 BSD 系统 的 
源 代码 ， 首 先 需 要 持 有 AT&T 的 UNIX 源 代 码 许可 证 。 这 种 情况 正在 改变 ， 近 几 年 ， 越 来 越 多 的 
AT&T 源 代码 被 替换 成 非 AT&T 源 代码 ， 很 多 添加 到 BSD 系统 上 的 新 功能 也 来 自 于 非 AT&T 方面 。 

1989 年 ， 伯 克利 将 4.3BSD Tahoe 中 很 多 非 AT&T 源 代码 包装 成 BSD 网 络 软件 1.0 版 ， 并 使 
其 成 为 可 公开 获得 的 软件 。1991 年 发 布 了 BSD 网 络 软件 2.0 版 ， 它 是 从 4.3BSD Reno 版 派生 出 
来 的 ， 其 目的 是 使 大 部 分 (如 果 不 是 全 部 的 话 ) 4.4BSD 系统 不 再 受 AT&T 许可 证 的 限制 ， 这 样 ， 
大 家 都 可 以 得 到 源 代码 。 

4.4BSD-Lite 是 CSRG 计划 开发 的 最 后 一 个 发 行 版 。 由 于 与 USL 产生 的 法 律 纠 纷 ， 该 版 本 曾 
一 度 延 迟 推出 。 在 纠纷 解决 后 ，4.4BSD-Lite 立即 于 1994 年 发 布 ， 并 且 不 再 需要 具有 UNIX 源 代 
码 使 用 许可 证 就 可 以 使 用 它 。1995 年 CSRG 发 布 了 修复 了 bug 的 版 本 。4.4BSD-Lite 第 2 发 行 版 
是 CSRG 的 最 后 一 个 BSD 版 本 (McKusick 等 [1996] 描 述 了 该 BSD 版 本 )。 
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在 伯克利 所 进行 的 UNIX 开发 工作 是 从 PDP-11 开始 的 ， 然 后 转移 到 VAX 小 型 机 上 ， 接 着 
又 转移 到 工作 站 上 。20 世纪 90 年 代 早 期 ， 伯 克利 得 到 支持 在 广泛 应 用 的 80386 个 人 计算 机 上 
开发 BSD 版 本 ， 结 果 产 生 了 386BSD。 这 一 工作 是 由 Bill Jolitz 完成 的 ， 其 工作 在 1991 年 全 年 
的 Dr. Dobb's 期 刊 上 以 每 月 一 篇 文章 连载 发 表 。 其 中 很 多 代码 出 现在 BSD 网 络 软件 2.0 版 中 。 


2.3.3 FreeBSD 


FreeBSD 基于 44BSD-Lite 操作 系统 。 在 加 州 大 学 伯克利 分 校 的 CSRG 决定 终止 其 在 UNIX 
操作 系统 的 BSD 版 本 的 研发 工作 ， 而 且 386BSD 项 目 被 忽视 很 长 时 间 之 后 ， 为 了 继续 坚持 BSD 
系列 ， 形 成 了 FreeBSD 项 目 。 

由 FreeBSD 项 目 产 生 的 所 有 软件 ， 包 括 其 二 进 制 代 码 和 源 代 码 ， 都 是 免费 使 用 的 。 为 了 测试 
中 的 实例 ， 本 书 选取 了 4 个 操作 系统 ，FreeBSD 8.0 操作 系统 是 其 中 之 一 。 

有 许多 基于 BSD 的 免费 操作 系统 。NetBSD AA (http://www.netbsd.org) 类 似 于 
FreeBSD 项 目 ， 但 是 更 注重 不 同 硬件 平台 之 间 的 可 移植 性 。OpenBSD AA (http://www.openbsd. 
org) 也 类 似 于 FreeBSD 项 目 ， 但 更 注重 于 安全 性 。 


2.3.4 Linux 


Linux 是 一 种 提供 类 似 于 UNIX 的 丰富 编程 环境 的 操作 系统 ， 在 GNU 公用 许可 证 的 指导 下 ， 
Linux 是 免费 使 用 的 。Linux 的 普及 是 计算 机 产业 中 的 一 道 亮丽 风景 线 。Linux 经 常 是 支持 较 新 人 硬 
件 的 第 一 个 操作 系统 ， 这 一 点 使 其 引 人 注 目 。 

Linux 是 由 Linus Torvalds 在 1991 年 为 替代 MINIX 而 研发 的 。 一 位 当时 名 不 见 经 传人 物 的 努 
力 掀 起 了 涪 洲 巨 浪 ， 吸 引 阴 布 全 世界 的 很 多 软件 开发 者 ， 在 使 用 和 不 断 增强 Linux 方面 自愿 页 
献 出 了 他 们 大 量 的 时 间 。 

Ubuntu 12.04 的 Linux 分 发 版 本 是 用 以 测试 本 书 实例 的 操作 系统 之 一 。 该 系统 使 用 了 Linux 
操作 系统 3.2.0 版 内 核 。 


2.3.5 MacOSX 


与 其 以 前 的 版 本 相 比 ，Mac OS X 使 用 了 完全 不 同 的 技术 。 其 核心 操作 系统 称 为 “Darwin”， 它 
基于 Mach 内 核 (Accetta 等 [1986])、FreeBSD 操作 系统 以 及 具有 面向 对 象 框架 的 驱动 和 其 他 内 核 
扩展 的 结合 。Mac OS X 10.5 的 Intel 部 分 已 经 被 验证 为 是 一 个 UNIX 系统 。( 关 于 UNIX 验证 的 更 
多 信息 ， 请 参见 http://www.opengroup.org/certification/idx/UNIX.html). 

Mac OS X 10.6.8 (Darwin 10.8.0) 是 用 以 测试 本 书 实例 的 操作 系统 之 一 。 


2.3.6 Solaris 


Solaris 是 由 Sun Microsystems (Jj Oracle) 开发 的 UNIX 系统 版 本 。 它 基于 SVR4， 在 超过 
15 年 的 时 间 里 ，Sun Microsystems 的 工程 师 对 其 功能 不 断 增强 。 它 是 唯一 在 商业 上 取得 成 功 的 
SVR4 后 裔 ， 并 被 正式 验证 为 UNIX 系统 。 

2005 年 ，Sun Microsystems 把 Solaris 操作 系统 的 大 部 分 源 代 码 开 放 给 公众 ， 作 为 OpenSolaris 
开放 源 代码 操作 系统 的 一 部 分 ， 试 图 建立 围绕 Solaris 的 外 部 开发 人 员 社 区 。 

Solaris 10 UNIX 操作 系统 也 是 用 以 测试 本 书 实例 的 操作 系统 之 一 。 
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2.3.7 其 他 UNIX 系统 


已 经 通过 验证 的 其 他 UNIX 版 本 包括 : 

e AIX, IBM 版 的 UNIX 系统 ; 

。 HP-UX, HP 版 的 UNIX 系统 ; 

e IRIX, Silicon Graphics 版 的 UNIX 系统 ; 

e UnixWare, SVR4 派生 的 UNIX 系统 ， 现 由 SCO 销售 。 


2.4 ”标准 和 实现 的 关系 


前 面 提 到 的 各 个 标准 定义 了 任 一 实际 系统 的 子 集 。 本 书 主要 关注 4 种 实际 的 UNIX 系统 : FreeBSD 
8.0、Linux 3.2.0. Mac OS X 10.6.8 和 Solaris 10。 在 这 4 种 系统 中 ， 虽 然 只 有 Mac OS X Fil Solaris 10 能 
够 称 自己 是 一 种 UNIX 系统 , 但 是 所 有 这 4 种 系统 都 提供 UNIX 编程 环境 。 因 为 所 有 这 4 种 系统 都 在 
不 同 程度 上 符合 POSIX 标准 ， 所 以 我 们 也 将 重点 关注 POSIX.1 标准 所 要 求 的 功能 ， 并 指出 这 4 种 系 
统 具 体 实现 与 POSIX 之 间 的 差别 。 仅 仅 一 个 特定 实现 所 具有 的 功能 和 例 程 会 被 清楚 地 标记 出 来 。 我 
们 还 关注 那些 属于 UNIX 系统 必需 的 ， 但 却 在 符合 POSIX 标准 的 系统 中 是 可 选 的 功能 。 

应 当 看 到 ， 这 些 实现 都 提供 了 对 它们 早期 版 本 (如 SVR3.2 和 4.3BSD) 功能 的 向 后 兼容 性 。 
例如 ，Solaris 对 POSIX.1 规范 中 的 非 阻 塞 I/O Co NONBLOCKO 以 及 传统 的 系统 V 中 的 方法 
(O_NDELAY) 都 提供 了 支持 。 本 书 将 只 使 用 POSIX.1 的 功能 ， 但 是 也 会 提 及 它 所 替换 的 是 哪 一 种 
非 标准 功能 。 与 此 相 类 似 ，SVR3.2 和 4.3BSD 以 某 种 方法 提供 了 可 靠 的 信号 机 制 ， 这 种 方法 也 有 别 
F POSIX.1 标准 。 第 10 章 将 只 说 明 POSIX.1 的 信号 机 制 。 


2.5 限制 


UNIX 系统 实现 定义 了 很 多 幻 数 和 常量 ， 其 中 有 很 多 已 被 硬 编码 到 程序 中 ， 或 用 特定 的 技术 
确定 。 由 于 大量 标准 化 工作 的 努力 ， 已 有 若干 种 可 移植 的 方法 用 以 确定 这 些 幻 数 和 具体 实现 定义 
的 限制 。 这 非常 有 助 于 改善 UNIX 环境 下 软件 的 可 移植 性 。 

以 下 两 种 类 型 的 限制 是 必需 的 。 

C1) 编译 时 限制 《例如 ， 短 整 型 的 最 大 值 是 什么 ? ) 

(2) 运行 时 限制 〈 例 如 ， 文 件 名 有 多 少 个 字符 ? ) 

编译 时 限制 可 在 头 文件 中 定义 。 程 序 在 编译 时 可 以 包含 这 些 头 文件 。 但 是 ， 运 行 时 限制 则 要 
求 进程 调用 一 个 函数 获得 限制 值 。 

男 外， 某 些 限制 在 一 个 给 定 的 实现 中 可 能 是 固定 的 (因此 可 以 静态 地 在 一 个 头 文件 中 定义 )， 而 在 
男 一 个 实现 中 则 可 能 是 变动 的 (需要 有 一 个 运行 时 函数 调用 )。 这 种 类 型 限制 的 一 个 例子 是 文件 名 的 最 
大 字符 数 。SVR4 之 前 的 系统 V 由 于 历史 原因 只 允许 文件 名 最 多 包含 14 个 字符 ， 而 源 于 BSD 的 系统 则 
将 此 增加 为 255。 目 前 ， 大 多 数 UNIX 系统 支持 多 文件 系统 类 型 ， 而 每 一 种 类 型 有 它 自 己 的 限制 。 文 件 
名 的 最 大 长 度 依赖 于 该 文件 处 于 何 种 文件 系统 ， 例 如 ， 根 文件 系统 中 的 文件 名 长 度 限制 可 能 是 14 个 字 
符 ， 而 在 男 一 个 文件 系统 中 文件 名 长 度 限 制 可 能 是 255 个 字符 ， 这 是 运行 时 限制 的 一 个 例子 。 

为 了 解决 这 类 问题 ， 提 供 了 以 下 3 种 限制 。 

(1) 编译 时 限制 〈 头 文件 )。 


[35 | 


[36 | 
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(2) 与 文件 或 目录 无 关 的 运行 时 限制 (sysconf 函数 )。 

(3) 与 文件 或 目录 有 关 的 运行 时 限制 (pathconf 和 fpathconf 函数 )。 

使 事情 变 得 更 加 复杂 的 是 ， 如 果 一 个 特定 的 运行 时 限制 在 一 个 给 定 的 系统 上 并 不 改变 ， 则 可 
将 其 静态 地 定义 在 一 个 头 文件 中 ， 但 是 ， 如 果 没 有 将 其 定义 在 头 文件 中 ， 应 用 程序 就 必须 调用 3 
个 conf 函数 中 的 一 个 〈 我 们 很 快 就 会 对 它们 进行 说 明 )， 以 确定 其 运行 时 的 值 。 


2.5.1 ISO C 限制 


ISO C 定义 的 所 有 编译 时 限制 都 列 在 头 文件 <limits .n> 中 ( 见 图 2-6)。 这 些 限制 常量 在 一 
个 给 定 系统 中 并 不 会 改变 。 表 中 第 3 列 列 出 了 ISO C 标准 可 接受 的 最 小 值 。 这 用 于 16 位 整 型 的 
系统 ,用 1 的 补 码 表示 。 第 4 列 列 出 了 32 位 整 型 Linux 系统 的 值 ， 用 2 的 补 码 表示 。 注 意 ， 我 们 
没有 列 出 无 符号 数据 类 型 的 最 小 值 ， 这 些 值 应 该 都 为 0。 在 64 位 系统 中 ， 其 long 整 型 的 最 大 值 
与 表 中 long long 整 型 的 最 大 值 相 匹配 。 


o] [omen e 


CHAR_BIT char 的 位 数 

CHAR_MAX char 的 最 大 值 
CHRR_MIN char 的 最 小 值 
SCHAR_MAX signed char 的 最 大 值 
SCHAR_MIN | signed char 的 最 小 值 —127 
UCHAR MAX | unsigned char 的 最 大 值 255 
INT MAX int 的 最 大 值 32 767 2 147 483 647 
INT_MIN int 的 最 小 值 一 32 767 一 2 147 483 648 
UINT_MAX unsigned int 的 最 大 值 65 535 4 294 967 295 
SHRT MAX short 的 最 大 值 32 767 32 767 
SHRT_MIN short 的 最 小 值 一 32 767 一 32 768 
USHRT_MAX | unsigned short 的 最 大 值 65 535 65 535 
LONG_MAX long 的 最 大 值 2 147 483 647 2 147 483 647 
LONG_MIN long 的 最 小 值 一 2 147 483 647 一 2 147 483 648 
ULONG_MAX | unsigned long 的 最 大 值 4 294 967 295 4 294 967 295 
LLONG MAX | long long 的 最 大 值 9 223 372 036 854 775 807 | 9223 372 036 854 775 807 
LLONG_MIN | long long 的 最 小 值 —9 223 372 036 854 775 807 | —9 223 372 036 854 775 808 
ULLONG_MAX | unsigned long long 的 最 大 值 18 446 744 073 709 551615 | 18446 744 073 709 551 615 


在 一 个 多 字 节 字符 常量 中 的 最 大 字 节 数 ae 7 
图 2-6 <limits.h> 中 定义 的 整 型 值 大 小 
我 们 将 会 遇 到 的 一 个 区 别 是 系统 是 否 提供 带 符号 或 无 符号 的 的 字符 值 。 从 图 2-6 中 的 第 4 列 可 
以 看 出 ， 该 特定 系统 使 用 带 符号 字符 。 从 图 中 可 以 看 到 CHAR MIN 等 于 SCHAR MIN, CHAR MAX 
等 于 SCHAR_MAX。 如 果 系统 使 用 无 符号 字符 ， 则 CHAR MINET 0. CHAR MAX 等 于 UCHAR MAX. 
在 头 文件 <float .h> 中 , 对 浮 点 数据 类 型 也 有 类 似 的 一 组 定义 。 如 若 读者 在 工作 中 涉及 大 量 
浮 点 数据 类 型 ， 则 应 仔细 查看 该 文件 。 
RISO C 标准 规定 了 整 型 数据 类 型 可 接受 的 最 小 值 ， 但 POSIX.1 对 C 标准 进行 了 扩充 。 为 了 符 
合 POSIX.1 标准 ， 具 体 实现 必须 支持 INT MAX 的 最 小 值 为 147 483 647, INT_MIN 为 2 147 483 647, 
UINT MAX 为 4 294 967 295。 因 为 POSIX.1 要 求 具体 实现 支持 8 位 的 char RAY, ATLA CHAR_BIT 必 
须 是 8，SCHAR_MIN 必须 是 一 128，SCHAR_MAX 必须 是 127, UCHAR MAX 必须 是 255。 
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我 们 会 遇 到 的 另 一 个 ISO C 常量 是 FOPEN_MAX, 这 是 具体 实现 保证 可 同时 打开 的 标准 IO 流 
的 最 小 个 数 ， 该 值 在 头 文件 <stdio .h> 中 定义 ， 其 最 小 值 是 8。POSIX.1 中 的 STREAM MAX (车 
定义 的 话 ) 则 应 与 FOPEN MAX 具有 相同 的 值 。 

ISO C 还 在 <stdio.h> 中 定义 了 常量 TMP_MAX， 这 是 由 tmpnam 函数 产生 的 唯一 文件 名 的 
最 大 个 数 。 关 于 此 常量 我 们 将 在 5.13 节 中 进行 更 多 说 明 。 

虽然 ISO C 定义 了 常量 FILENAME_MAX， 但 我 们 应 避免 使 用 该 常量 ， 因 为 POSIX.1 提供 了 
更 好 的 替代 常量 (NAME MAX 和 PATH_MAX)， 我 们 很 快 就 会 介绍 该 常量 。 

在 图 2-7 中 ,我们 列 出 了 本 书 所 讨论 4 种 平台 上 的 FILENAME MAX. FOPEN MAX 和 TMP_MAX ffi. 


限制 FreeBSD 8.0 Linux 3.2.0 Mac OS X 10.6.8 | Solaris 10 | 











FOPEN_MAX 20 16 20 20 
TMP_MAX 308 915 776 238 328 308 915 776 17576 
FILENAME MAX 1 024 4 096 1024 1024 


图 2-7 在 各 种 平台 上 ISO 的 限制 


2.5.2 POSIX 限制 


POSIX.1 定义 了 很 多 涉及 操作 系统 实现 限制 的 常量 ， 遗 憾 的 是 ， 这 是 POSIX.1 中 最 令 人 迷惑 
不 解 的 部 分 之 一 。 虽 然 POSIX.1 定义 了 大 量 限制 和 常量 , 我 们 只 关心 与 基本 POSIX.1 接口 有 关 的 
部 分 。 这 些 限 制 和 常量 分 成 下 列 7 类 。 

CD 数值 限制 : LONG BIT. SSIZE MAX 和 WORD_BIT。 

(2) 最 小 值 : 图 2-8 中 的 25 个 常量 。 

(3) 最 大 值 : POSIX CLOCKRES MIN. 

(4) 运行 时 可 以 增加 的 值 : CHARCLASS NAME MAX. COLL WEIGHTS MAX. LINE MAX. 
NGROUPS MAX ll RE DUP MAX. 

(5) 运行 时 不 变 值 (可 能 不 确定 ): 图 2-9 中 的 17 个 常量 (加 上 12.2 节 中 介绍 的 4 个 常量 和 
14.5 节 中 介绍 的 3 个 常量 )。 

(6) 其 他 不 变 值 : NL ARGMAX. NL MSGMAX. NL SETMAX 和 NL_TEXTMAX。 

(7) 路 径 名 可 变 值 : FILESIZEBITS. LINK MAX. MAX CANON. MAX INPUT. NAME MAX, 
PATH MAX. PIPE BUF 和 SYMLINK MAX. 

在 这 些 限制 和 常量 中 ， 某 些 可 能 定义 在 <Limits .n> 中 ， 其 余 的 则 按 具 体 条 件 可 定义 、 可 不 
定义 。 在 2.5.4 节 中 说 明 sysconf、pathconf 和 fpathconf 函数 时 ， 我 们 将 描述 可 定义 或 可 
不 定义 的 限制 和 常量 。 在 图 2-8 中 ， 我 们 列 出 了 25 个 最 小 值 。 

这 些 最 小 值 是 不 变 的 一 一 它们 并 不 随 系 统 而 改变 。 它 们 指定 了 这 些 特征 最 具 约束 性 的 值 。 一 
个 符合 POSIX.1 的 实现 应 当 提供 至 少 这 样 大 的 值 。 这 就 是 为 什么 将 它们 称 为 最 小 值 ， 虽 然 它们 的 
名 字 都 包含 了 MAX。 另 外， 为 了 保证 可 移植 性 ， 一 个 严格 符合 POSIX 标准 的 应 用 程序 不 应 要 求 
更 大 的 值 。 我 们 将 在 本 书 的 适当 章节 说 明 每 一 个 常量 的 含义 。 

一 个 严格 符合 ( strictly conforming ) POSIX 的 应 用 区 别 于 一 个 刚刚 符合 POSIX ( merely POSIX 
confirming ) 的 应 用 。 符 合 POSIX 的 应 用 只 使 用 在 IEEE 1003.1-2001 中 定义 的 接口 。 严 格 符合 POSIX 
的 应 用 满足 更 多 的 限制 ， 例 如 ， 不 依赖 于 POSIX 未 定义 的 行为 、 不 使 用 其 任何 已 弃 用 的 接口 以 及 
不 要 求 所 使 用 的 常量 值 大 于 图 2-8 中 所 列 出 的 最 小 值 。 
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_POSIX_ARG_MAX exec 国 数 的 参数 长 度 
POSIX CHILD MAX 每 个 实际 用 户 ID 的 子 进程 数 
POSIX DELAYTIMER MAX | 定时 器 最 大 超 限 运行 次 数 
POSIX HOST NAME MAX gethostname 函数 返回 的 主机 名 长 度 
_POSIX_LINK_MAX 至 一 个 文件 的 链接 数 
POSIX LOGIN NAME MAX | 登录 名 的 长 度 
POSIX MAX CANON 终端 规范 输入 队列 的 字 节 数 
POSIX MAX INPUT 终端 输入 队列 的 可 用 空间 
_POSIX_NAME_MAX 文件 名 中 的 字 节 数 ， 不 包括 终止 null 字 节 
POSIX NGROUPS MAX 每 个 进程 同时 添加 的 组 ID 数 
POSIX OPEN MAX 每 个 进程 的 打开 文件 数 
POSIX PATH MAX 路 径 名 中 的 字 节 数 ， 包 括 终 止 null 字 节 
_POSIX_PIPE_BUF 能 原子 地 写 到 一 个 管道 中 的 字 节 数 

当 使 用 间隔 表示 法 \{m, nV) 时 , regexec Al regcomp 函数 允许 
aa i 的 基本 正则 表达 式 重复 发 生 次 数 
_POSIX_RTSIG_MAX 为 应 用 预 留 的 实时 信号 编号 个 数 
POSIX SEM NSEMS MAX 一 个 进程 可 以 同时 使 用 的 信号 量 个 数 
_POSIX_SEM VALUE MAX 信号 量 可 持 有 的 值 
_POSIX_SIGQUEUE_MAX -个 进程 可 发 送 和 挂 起 的 排队 信号 的 个 数 
_POSIX_SSIZE_MAX 能 存在 ssize_t 对 象 中 的 值 
_POSIX_STREAM_MAX -个 进程 能 同时 打开 的 标准 VO 流 数 
_POSIX_SYMLINK_MAX 符号 链接 中 的 字 节 数 
_POSIX_SYMLOOP_MAX 在 解析 路 径 名 时 ， 可 遍历 的 符号 链接 数 
_POSIX_TIMER MAX 每 个 进程 的 定时 器 数目 
_POSIX_TTY_NAME_MAX 终端 设备 名 长 度 ， 包 括 终止 null 字 节 
POSIX TZNAME MAX 时 区 名 字 节 数 


图 2-8 <limits.h> 中 的 POSIX.1 最 小 值 

遗憾 的 是 ， 这 些 不 变 最 小 值 中 的 某 一 些 在 实际 应 用 中 太 小 了 。 例 如 ， 目 前 在 大 多 数 UNIX 系 
统 中 ,每 个 进程 可 同时 打开 的 文件 数 远 远 超过 20。 男 外 ，POSIX_PATH_MAX 的 最 小 限制 值 为 255， 
这 太 小 了 ， 路 径 名 可 能 会 超过 这 一 限制 。 这 意味 着 在 编译 时 不 能 使 用 _POSIX_OPEN_MAX 和 
_POSIX_PATH_MAX 这 两 个 常量 作为 数组 长 度 。 

图 2-8 中 的 25 个 不 变 最 小 值 的 每 一 个 都 有 一 个 相关 的 实现 值 ， 其 名 字 是 将 图 2-8 中 的 名 字 删 
除 前 级 _POSIX_ 后 构成 的 ,没有 _POSIX 前 绥 的 名 字 用 于 给 定 具 体 实现 支持 的 该 不 变 最 小 值 的 实 
际 值 (这 25 个 实现 值 是 本 节 开 始 部 分 所 列 出 的 1、4、5、7 类 : 2 个 是 运行 时 可 以 增加 的 值 、15 
个 是 运行 时 不 变 值 、7 个 是 路 径 名 可 变 值 ， 以 及 数值 SSIZE_MAX)。 问 题 是 并 不 能 确保 所 有 这 25 
个 实现 值 都 在 <1imit .h> 头 文件 中 定义 。 

例如 ， 某 个 特定 值 可 能 不 在 此 头 文件 中 定义 ， 其 理由 是 : 一 个 给 定 进程 的 实际 值 可 能 依 
赖 于 系统 的 存储 总 量 。 如 果 没 有 在 头 文件 中 定义 它们 ， 则 不 能 在 编译 时 使 用 它们 作为 数组 边 
界 。 所 以 ，POSIX.1 提供 了 3 个 运行 时 函数 以 供 调用 ， 它 们 是 : sysconf. pathconf 以 及 
fpathconf。 使 用 这 3 个 函数 可 以 在 运行 时 得 到 实际 的 实现 值 。 但 是 ， 还 有 一 个 问题 ， 其 中 
某 些 值 由 POSIX.1 定义 为 “可 能 不 确定 的 ”( 逻 辑 上 无 限 的 )， 这 就 意味 着 该 值 没 有 实际 上 
限 。 例如， 在 Solaris 中 ,进程 结束 时 注册 可 运行 atexit 的 函数 个 数 仅 受 系统 存储 总 量 的 限 
制 。 所 以 在 Solaris 中 ，ATEXIT_MAX 被 认为 是 不 确定 的 。2.5.5 节 还 将 讨论 运行 时 限制 不 确 
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定 的 问题 。 


最 小 可 接受 值 


ARG_MAX exec 函数 族 的 参数 最 大 长 度 _POSIX_ARG_MAX 
ATEXIT_MAX 可 用 atexit 函数 登记 的 最 大 函数 个 数 32 

CHILD_MAX 每 个 实际 用 户 ID 的 子 进 程 最 大 个 数 _POSIX_CHILD_MRX 
DELAYTIMER_MAX 定时 器 最 大 超 限 运行 次 数 _POSIX_DELAYTIMER_MAX 
HOST NAME MAX gethostname 返回 的 主机 名 长 度 _POSIX_HOST_NAME_MAX 
LOGIN_NAME_MAX 登录 名 最 大 长 度 POSIX LOGIN NAME MAX 
OPEN MAX 赋予 新 建文 件 描述 符 的 最 大 值 +1 _POSIX_OPEN_MAX 
PAGESIZE 系统 内 存 页 大 小 (以 字 节 为 单位 》 1 

RTSIG MAX 为 应 用 程序 预 留 的 实时 信号 的 最 大 个 数 _POSIX_RTSIG_MAX 
SEM_NSEMS_MAX 一 个 进程 可 使 用 的 信号 量 最 大 个 数 _POSIX_SEM_NSEMS_MAX 
SEM_VALUE_MAX 信和 号 量 的 最 大 值 _POSIX_SEM_VALUE_MAX 
SIGQUEUE MAX 一 个 进程 可 排队 信号 的 最 大 个 数 _POSIX_SIGQUEUE_MAX 
STREAM_MAX 一 个 进程 一 次 可 打开 的 标准 IO 流 的 最 大 个 数 _POSIX_STREAM MAX 
SYMLOOP_MAX 路 径 解 析 过 程 中 可 访问 的 符号 链接 数 _POSIX_SYMLOOP_MRX 
TIMER_MAX 一 个 进程 的 定时 器 最 大 个 数 _POSIX_TIMER_MRX 

TTY NAME MAX 终端 设备 名 长 度 ， 其 中 包括 终止 的 null 字 节 _POSIX_TTY_NAME_MAX 
TZNAME_MAX 时 区 名 的 字 节 数 _POSIX_TZNAME_MAX 


图 2-9 <limits.h> ff} POSIX.1 运行 时 不 变 值 








2.5.3 XSI 限制 


XSI 定义 了 代表 实现 限制 的 几 个 常量 。 

(OD 最 小 值 : 图 2-10 中 列 出 的 5 个 常量 。 

(2) 运行 时 不 变 值 〈 可 能 不 确定 ): IOV_MAX 和 PAGE_SIZE. 

图 2-10 列 出 了 最 小 值 。 最 后 两 个 常量 值 说 明了 POSIX.1 最 小 值 太 小 的 情况 ， 根 据 推 测 这 可 
能 是 考虑 到 了 嵌入 式 POSIX.1 实现 。 为 此 ，Single UNIX Specification 为 符合 XSI 的 系统 增加 了 具 


有 较 大 最 小 值 的 符号 。 
最 小 可 接受 值 





NL_LANGMAX 在 LANG 环境 变量 中 最 大 字 节 数 
NZERO 默认 进程 优先 级 


_XOPEN_IOV_MAX readv 或 writev 可 使 用 的 最 多 iovec 结构 个 数 
 XOPEN NAME MAX 文件 名 中 的 字 节 数 
_XOPEN_PATH_MAX 路 径 名 中 的 字 节 数 





2-10 <limits.h> 中 的 XSI 最 小 值 


2.5.4 eB sysconf、pathconf 和 fpathconf 


我 们 已 列 出 了 实现 必须 支持 的 各 种 最 小 值 ， 但 是 怎样 才能 找到 一 个 特定 系统 实际 支持 的 限制 
值 呢 ? 正如 前 面 提 到 的 ， 某 些 限 制 值 在 编译 时 是 可 用 的 ， 而 另外 一 些 则 必须 在 运行 时 确定 。 我 们 
也 曾 提 及 某 些 限制 值 在 一 个 给 定 的 系统 中 可 能 是 不 会 更 改 的 ， 而 其 他 限制 值 可 能 会 更 改 ， 因 为 它 
们 与 文件 和 目录 相关 联 。 运 行 时 限制 可 调用 下 面 3 个 函数 之 一 获得 。 
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#include <unistd.h> 
long sysconf (int name) ; 
long pathconf (const char *pathname, int name); 


log fpathconf(int fd, int name); 





所 有 函数 返回 值 : 若 成 功 ， 返 回 相应 值 ， 若 出 错 ， 返 回 -1《〈 见 后 ) 


后 面 两 个 函数 的 差别 是 : 一 个 用 路 径 名 作为 其 参数 ， 另 一 个 则 取 文 件 描 述 符 作 为 参数 。 

图 2-11 中 列 出 了 sysconf 函数 所 使 用 的 name 参数 , 它 用 于 标识 系统 限制 。 以 _sc_ 开 始 的 常量 用 
作 标 识 运行 时 限制 的 sysconf 参数 。 图 2-12 列 出 了 pathconf 和 fpathconf 函数 为 标识 系统 限制 
所 使 用 的 name 参数 。 以 _PC_ 开 始 的 常量 用 作 标 识 运行 时 限制 的 pathconf 或 fpathconf BR. 

我 们 需要 更 详细 地 讨论 一 下 这 3 个 函数 不 同 的 返回 值 。 

(1) 如 果 name 参数 并 不 是 一 个 合适 的 常量 ， 这 3 个 函数 都 返回 一 1， 并 把 errno EJ EINVAL. 
图 2-11 和 图 2-12 的 第 3 列 给 出 了 我 们 在 整 本 书 中 将 要 涉及 的 限制 常量 。 

(2) 有 些 name 会 返回 一 个 变量 值 (返回 值 宇 0) 或 者 提示 该 值 是 不 确定 的 。 不 确定 的 值 通过 
返回 一 1 来 体现 ， 而 不 改变 errno 的 值 。 

















exec 函数 的 参数 最 大 长 度 〈 字 节 ) 
可 用 atexit 函数 登记 的 最 大 函数 个 数 
每 个 实际 用 户 ID 的 最 大 进程 数 
每 秒 时 钟 滴答 数 
在 本 地 定义 文件 中 可 以 赋予 LC_COLLRTE 顺序 关 
键 字 项 的 最 大 权重 数 
定时 器 最 大 超 限 运 行 次 数 
gethostname 函数 返回 的 主机 名 最 大 长 度 
readv 或 writev 函数 可 以 使 用 最 多 的 iovec 结 
构 的 个 数 


_SC_ARG_MAX 
_SC_ATEXIT_MAX 

.SC CHILD MAX 

.SC CLK TCK 

.SC COLL WEIGHTS MAX 


ARG MAX 
ATEXIT MAX 
CHILD MAX 
时 钟 滴答 / 秒 
COLL_WEIGHTS_MAX 




























_SC_DELAYTIMER_MAX 
_SC_HOST_NAME_MAX 
_SC_IOV_MAX 


DELAYTIMER_MAX 
HOST_NAME_MAX 
TOV_MAX 




























PAGESIZE 
PAGE_SIZE 


LINE_MAX 实用 程序 输入 行 的 最 大 长 度 _SC_LINE_MRX 
LOGIN_NAME_MAX 登录 名 的 最 大 长 度 _SC_LOGIN_NAME_MAX 
NGROUPS_MAX 每 个 进程 同时 添加 的 最 大 进程 组 ID 数 _SC_NGROUPS_MAX 
OPEN_MAX 每 个 进程 最 大 打开 文件 数 _SC_OPEN_MAX 


系统 存储 页 长 度 〈 字 节 数 ) 
系统 存储 页 长 度 ( 字 节 数 ) 










_SC_PAGESIZE 
_SC_PAGE_SIZE 





当 使 用 间隔 表示 法 \{m, n\} 时 ， 函 数 regexec 和 
regcomp 允许 的 基本 正则 表达 式 重复 发 生 次 数 
为 应 用 程序 预 留 的 实时 信号 的 最 大 个 数 


_SC_RE_DUP_MAX 











RE_DUP_MAX 










RTSIG MAX .SC RTSIG MAX 
















STREAM MAX 













SYMLOOP MAX 
TIMER MAX 

TTY NAME MAX 
TZNAME MAX 


SEM NSEMS MAX 一 个 进程 可 使 用 的 信号 量 最 大 个 数 _SC_SEM_NSEMS_MRX 
SEM_VALUE_MAX 信和 号 量 的 最 大 值 _SC_SEM_VALUE_MAX 
SIGQUEUE_MAX 一 个 进程 可 排队 信号 的 最 大 个 数 .SC SIGQUEUE MAX 


—^* SC STREAM MAX 进程 在 任意 给 定时 刻 标 准 IO 
流 的 最 大 个 数 。 如 果 定 义 ， 必 须 与 FOPEN_MAX 有 相同 值 
在 解析 路 径 名 时 ， 可 遍历 的 符号 链接 数 


每 个 进程 的 最 大 定时 器 个 数 


终端 设备 名 长 度 ， 包 括 终 止 null 字 节 


时 区 名 中 的 最 大 字 节 数 


2-11 对 sysconf 的 限制 及 name 参数 















_SC_STREAM_MAX 





_SC_SYMLOOP_MAX 
_SC_TIMER_MAX 
_SC_TTY_NAME_MAX 
_SC_TZNAME_MAX 
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FILESIZEBITS 以 带 符号 整 型 值 表示 在 指定 目 | PC FILESIZEBITS 
录 中 允许 的 普通 文件 最 大 长 度 所 
需 的 最 小 位 (bit) 数 
LINK_MAX 文件 链接 计数 的 最 大 值 _PC_LINK_MAX 
MAX_CANON 终端 规范 输入 队列 的 最 大 字 节 数 | _PC_MAX_CANON 
MAX_INPUT 终端 输入 队列 可 用 空间 的 字 节 数 | PC MAX INPUT 















NAME MAX 文件 名 的 最 大 字 节 数 〈 不 包括 


终止 null 字 节 ) 
相对 路 径 名 的 最 大 字 节 数 ， 包 

括 终 止 null 字 节 

能 原子 地 写 到 管道 的 最 大 字 节 数 

文件 时 间 戳 的 纳 秒 精度 

符号 链接 的 字 节 数 


图 2-12 对 pathconf 和 fpathconf 的 限制 及 name 参数 


(3) sc CLK TCK 的 返回 值 是 每 秒 的 时 钟 滴答 数 ， 用 于 times 函数 的 返回 值 (8.17 节 )。 

对 于 pathconf 的 参数 pathname 和 fpathconf 的 参数 应 有 很 多 限制 。 如 果 不 满足 其 中 任 
何 一 个 限制 ， 则 结果 是 未 定义 的 。 

(1) PC MAX CANON 和 _PC_MAX_INPUT 引用 的 文件 必须 是 终端 文件 。 

(2) PC LINK MAX 和 _PC_TIMESTAMP_RESOLUTION 引用 的 文件 可 以 是 文件 或 目录 。 如 
果 是 目录 ， 则 返回 值 用 于 目录 本 身 ， 而 不 用 于 目录 内 的 文件 名 项 。 

(3) PC FILESIZEBITS Él PC NAME MAX 引用 的 文件 必须 是 目录 ， 返 回 值 用 于 该 目录 中 
的 文件 名 。 

(4) PC PATH MAX 引用 的 文件 必须 是 目录 。 当 所 指定 的 目录 是 工作 目录 时 ， 返 回 值 是 相对 
路 径 名 的 最 大 长 度 〈( 遗 憾 的 是 ， 这 不 是 我 们 想 要 知道 的 一 个 绝对 路 径 名 的 实际 最 大 长 度 ， 我 们 将 
在 2.5.5 节 中 再 次 回 到 这 一 问题 上 来 )。 

(5) PC PIPE BUF 引用 的 文件 必须 是 管道 、FIFO 或 目录 。 在 管道 或 FIFO 情况 下 ， 返 回 
值 是 对 所 引用 的 管道 或 FIFO 的 限制 值 。 对 于 目录 ， 返 回 值 是 对 在 该 目录 中 创建 的 任 一 FIFO 的 
限制 值 。 

(6) _PC_SYMLINK MAX 引用 的 文件 必须 是 目录 。 返 回 值 是 该 目录 中 符号 链接 可 包含 字符 串 
的 最 大 长 度 。 


s XH 
图 2-13 中 所 示 的 awk(1) 程 序 构建 了 一 个 C 程序 ， 它 打印 各 pathconf 和 sysconf 符号 的 值 。 


#!/usr/bin/awk -f 
BEGIN { 
printf ("#include \"apue.h\"\n") 
printf ("#include <errno.h>\n") 
printf ("#include <limits.h>\n") 
printf ("Mn") 
printf("static void pr_sysconf(char *, int);\n") 


_PC_NAME_MAX 





PATH_MAX _PC_PATH_MAX 












PIPE_BUF 
_POSTX_TIMESTAMP_RESOLUTION 
SYMLINK_MAX 


_PC_PIPE_BUF 
_PC_TIMESTAMP_RESOLUTION 
_PC_SYMLINK_MAX 









printf("static void pr pathconf(char *, char *, int);\n") 
printf ("Mn") 
printf (“int\n") 
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44 


END 
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printf ("main(int argc, char *argv[])\n") 
printf ("{\n"} 
printf("\tif (argc != 2)\n") 
printf ("\t\terr_ quit(\"usage: a.out <dirname>\");\n\n") 
FS="\t+" 
while (getline <"sysconf.sym" > 0) { 
printf ("#ifdef %s\n", $1) 
printf ("\tprintf(\"%s defined to be %%ld\\n\", (long) %s+0);\n", $1, $1) 
printf ("#else\n") 
printf ("\tprintf(\"no symbol for %s\\n\");\n", $1) 
printf ("#endif\n") 
printf ("#ifdef %s\n", $2) 
printf ("\tpr_sysconf(\"%s =\", %s);\n", $1, $2) 
printf ("#else\n") 
printf ("\tprintf(\"no symbol for %s\\n\");\n", $2) 
printf ("#endif\n") 
} 
close ("sysconf.sym") 
while (getline <"pathconf.sym" > 0) { 
printf ("#ifdef ts\n", $1) 
printf ("\tprintf(\"%s defined to be %%ld\\n\", (long) %s+0);\n", $1, $1) 
printf ("#else\n") 
printf ("\tprintf(\"no symbol for %s\\n\");\n", $1) 
printf ("#endif\n") 
printf ("#ifdef %s\n", $2) 
printf ("\tpr_pathconf(\"%s =\", argv[1], %s);\n", $1, $2) 
printf ("#else\n") 
printf ("\tprintf(\"no symbol for %s\\n\");\n", $2) 
printf ("#endif\n") 


close ("pathconf.sym") 
exit 


{ 

printf ("\texit (0);\n") 

printf ("}\n\n") 

printf ("static void\n") 

printf ("pr_sysconf(char *mesg, int name) \n") 
printf ("{\n"} 

printf ("\tlong val; Mn Wn") 

printf ("\tfputs (mesg, stdout) ;\n") 
printf("\terrno = 0;\n") 

printf("\tif ((val = sysconf(name)) < 0) {\n"} 
printf("\t\tif (errno != 0) {\n"} 

printf ("\t\t\tif (errno == EINVAL) \n") 

printf ("\t\t\t\tfputs(\" (not supported) \\n\", stdout) ;\n") 
printf ("\t\t\telse\n") 

printf ("\t\t\t\terr sys(\"sysconf error\");\n") 
printf("\t\t) else {\n"} 

printf£("\t\t\tfputs(\" (no limit) \\n\", stdout) ;\n") 
printf ("\t\t) Mn") 

printf("Nt) else {\n"} 

printf("\t\tprintf£(\" S$ld\\n\", val);\n") 
printf ("\t) \n") 
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printé ("}\n\n") 

printf ("static void\n") 

printf ("pr pathconf(char *mesg, char *path, int name) \n") 
printf ("{\n"} 

printf("\tlong val; Mn") 

printf ("Nn") 

printf("\tfputs (mesg, stdout) ;\n") 

printf("\terrno = 0;\n") 

printf("Ntif ((val = pathconf(path, name)) < 0) {\n"} 
printf("NtNtif (errno != 0) {\n"} 

printf£("\t\t\tif (errno == EINVAL) \n") 

printf ("\t\t\t\tfputs(\" (not supported) \\n\", stdout) ;\n") 
printf ("\t\t\telse\n") 

printf ("\t\t\t\terr sys(\"pathconf error, path = %%s\", path);\n") 
printf("NtNt) else {\n"} 

print£("\t\t\tfputs(\" (no limit) \\n\", stdout) ;\n") 
printf (NENEN Mn") 

printf("Nt) else {\n"} 

printf ("\t\tprintf£(\" S%ld\\n\", val); Nn") 
printf("NtyXpn") 

printf(")Nn") 


图 2-13 构建 C 程序 以 打印 所 有 得 到 支持 的 系统 配置 限制 
该 awk 程序 读 两 个 输入 文件 一 pathconf.sym 和 sysconfig.sym， 这 两 个 文件 中 包含 
了 用 制 表 符 分 隔 的 限制 名 和 符号 列表 。 并 非 每 种 平台 都 定义 所 有 符号 ， 所 以 围绕 每 个 Pathconf 
和 sysconf 调用 ，awk 程序 都 使 用 了 必要 的 #ifdef 语句 。 
例如 ，awk 程序 将 输入 文件 中 类 似 于 下 列 形式 的 行 : 
NAME MAX PC NAME MAX 
转换 成 下 列 C 代码 : 


#ifdef NAME MAX 
printf ("NAME MAX is defined to be %d\n", NAME MAX+0); 


#else 
printf("no symbol for NAME MAX\n"); 
#endif 
#ifdef PC NAME MAX 
pr pathconf ("NAME MAX =", argv[1], _PC NAME MAX); 
#else 
printf("no symbol for _PC_NAME MAX\n"); 
#endif : 


由 awk 产生 的 C 程序 如 图 2-14 所 示 ， 它 会 打印 所 有 这 些 限制 ， 并 处 理 未 定义 限制 的 情况 。 





#include "apue.h" 
#include <errno.h> 
#include <limits.h> 


static void pr_sysconf(char *, int); 
static void pr pathconf(char *, char *, int); 


int 
main(int argc, char *argv[]) 
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if (argc != 2) 


err quit("usage: a.out <dirname>") ; 


#ifdef ARG MAX 

printf ("ARG MAX defined to be %ld\n", 
#else 

printf("no symbol for ARG MAX\n"); 
#endif 
#ifdef SC ARG MAX 

pr sysconf("ARG MAX -", SC ARG MAX); 
#else 

printf ("no symbol for SC ARG MAX\n"); 
endif 


/* similar processing for all the rest of the sysconf symbols... 


#ifdef MAX CANON 


printf("MAX CANON defined to be %ld\n", 


#else 

printf("no symbol for MAX_CANON\n"); 
#endif 
#ifdef _PC_MAX CANON 


(long) ARG_MAX+0) ; 


pr_pathconf ("MAX CANON =", argv[1], PC MAX CANON); 


#else 


printf ("no symbol for PC MAX CANON\n"); 


#endif 


/* similar processing for all the rest of the pathconf symbols... 


exit (0); 


static void 
pr_sysconf (char *mesg, int name) 
{ 


long val; 


fputs (mesg, stdout); 
errno = 0; 
if ((val = sysconf(name)) < 0) { 
if (errno != 0) { 
if (errno == EINVAL) 


fputs(" (not supported) \n", stdout); 


else 
err sys("sysconf error"); 
) else { 


fputs(" (no limit)\n", stdout); 


} 
} else { 
printf(" $1dWMn", val); 


static void 


(long) MAX_CANON+0) ; 


wy 


*/ 
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pr_pathconf (char *mesg, char *path, int name) 


{ 


long val; 


fputs (mesg, stdout); 
errno = 0; 
if ((val = pathconf(path, name)) < 0) { 


if (errno != 0) { 
if (errno == EINVAL) 
fputs(" (not supported) \n", stdout); 
else 


err_sys("pathconf error, path = %s", path); 
} else { 
fputs(" (no limit)\n", stdout) ; 
} 
} else { 
printf(" 9*1dMn", val); 








图 2-14 打印 所 有 可 能 的 sysconf fll pathconf 值 
图 2-15 总 结 了 在 本 书 讨论 的 4 种 系统 上 图 2-14 所 示 程 序 的 输出 结果 。“ 无 符号 ”项 表示 该 系 


统 没 有 提供 相应 _sc Bk PC 符号 以 查询 相关 常量 值 。 因 此 ， 该 限制 是 未 定义 的 。 与 此 对 比 ,“ 不 支 
持 ” 项 表示 该 符号 由 系统 定义 ， 但 是 未 被 sysconf 和 pathcon 函数 识别 。“ 无 限制 ”项 表示 该 
系统 将 相关 常量 定义 为 无 限制 ， 但 并 不 表示 该 限制 值 可 以 是 无 限 的 ， 它 只 表示 该 限制 值 不 确定 。 





Solaris 10 
UFS 文件 系统 | PCRS 文件 系统 


ARG_MAX 262 144 2.097 152 262 144 2 096 640 2 096 640 
ATEXIT MAX 32 | 2147 483 647 2 147 483 647 无 限制 无 限制 
CHARCLASS_NAME_MAX 无 符号 2 048 14 14 
CHILD_MAX 1 760 47211 8 021 8021 
时 钟 滴答 / 秒 128 100 

COLL_WEIGHTS_MAX 255 

FILESIZEBITS 64 

HOST NAME MAX 64 

IOV MAX 

LINE MAX 

LINK MAX 
LOGIN NAME MAX 
MAX CANON 

MAX INPUT 

NAME MAX 
NGROUPS MAX 
OPEN MAX 
PAGESIZE 

PAGE SIZE 
PATH MAX 

PIPE BUF 

RE DUP MAX 
STREAM MAX 
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SYMLINK_MAX 
SYMLOOP_MAX 


TTY NAME MAX 
TZNAME MAX 





图 2-15 配置 限制 的 实例 


注意 ， 有 些 限 制 报告 地 并 不 正确 。 例 如 , 在 Linux P, SYMLOOP MAX 被 报告 成 无 限制 ,但 是 
检查 源 代 码 后 就 会 发 现 ， 实 际 上 它 在 硬 编码 中 有 限制 值 ， 这 一 限制 将 循环 缺失 的 情况 下 遍历 连续 
符号 链接 的 数目 限制 为 40 (参阅 fs/namei.c 中 的 follow link 函数 )。 

Linux 中 另 一 个 潜在 的 不 精确 的 来 源 是 pathconf 和 fpathconf 函数 都 是 在 C 库 函 数 中 实 
现 的 ， 这 些 函 数 返回 的 配置 限制 依赖 于 底层 的 文件 系统 类 型 ， 因 此 如 果 你 的 文件 系统 不 被 C EM 
知 的 话 ， 函 数 返 回 的 是 一 个 猜测 值 。 


我 们 将 在 4.14 WHAE, UFS 是 Berkeley 快速 文件 系统 的 SVR4 实现 ，PCFS 是 Solaris 的 
MS-DOS FAT 文件 系统 的 实现 。 u 


2.5.5 不 确定 的 运行 时 限制 


前 面 已 提 及 某 些 限 制 值 可 能 是 不 确定 的 。 我 们 遇 到 的 问题 是 ， 如 果 这 些 限 制 值 没 有 在 头 文件 
<limits.h> 中 定义 ， 那 么 在 编译 时 也 就 不 能 使 用 它们 。 但 是 ， 如 果 它 们 的 值 是 不 确定 的 ， 那 么 
在 运行 时 它们 可 能 也 是 未 定义 的 。 让 我 们 来 观察 两 个 特殊 的 情况 ， 为 一 个 路 径 名 分 配 存储 区 ， 以 
及 确定 文件 描述 符 的 数目 。 

1. 路 径 名 

很 多 程序 需要 为 路 径 名 分 配 存 储 区 ， 一 般 来 说 ， 在 编译 时 就 为 其 分 配 了 存储 区 ， 而 且 不 同 的 
程序 使 用 各 种 不 同 的 幻 数 ( 其 中 很 少 是 正确 的 ) 作为 数组 长 度 ， 如 256、512、1 024 或 标准 VO 常 
Ht BUFSIZ. 43BSD 头 文件 <sys/pParam.h> 中 的 常量 MAXPATHLEN 才 是 正确 的 值 ， 但 是 很 多 
4.3BSD 应 用 程序 并 未 使 用 它 。 

POSIX.1 试图 用 PATH_MAX 值 来 帮助 我 们 , 但 是 如 果 此 值 是 不 确定 的 , 那么 仍 是 毫 无 帮助 的 。 
图 2-16 程序 是 本 书 用 来 为 路 径 名 动态 分 配 存储 区 的 函数 。 

#include "apue.h" 


#include <errno.h> 
#include <limits.h> 








#ifdef PATH MAX 

static long pathmax = PATH MAX; 
#else 

static long pathmax = 0; 

#endif 


static long posix version = 0; 
static long xsi version = 0; 


/* If PATH MAX is indeterminate, no guarantee this is adequate */ 
#define PATH MAX GUESS 1024 


char + 
path alloc(size t *sizep) /* also return allocated size, if nonnull */ 
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char *ptr; 
size t size; 


if (posix version -- 0) 
posix version - sysconf( SC VERSION); 


if (xsi version == 0) 
xsi version = sysconf( SC XOPEN VERSION); 


if (pathmax == 0) { /* first time through */ 
errno = 0; 
if ((pathmax = pathconf("/", PC PATH MAX)) < 0) { 


if (errno == 0) 
pathmax = PATH MAX GUESS; /* it's indeterminate */ 
else 
err sys("pathconf error for PC PATH MAX"); 
) else { 
pathmax++; /* add one since it's relative to root */ 


) 


/* 
* Before POSIX.1-2001, we aren't guaranteed that PATH MAX includes 
* the terminating null byte. Same goes for XPG3. 
id 
if ((posix version « 200112L) && (xsi version « 4)) 
size = pathmax + 1; 
else 
size - pathmax; 


if ((ptr = malloc(size)) -- NULL) 
err sys("malloc error for pathname"); 


if (sizep !- NULL) 
*sizep - size; 
return(ptr); 


图 2-16 为 路 径 名 动态 地 分 配 空间 

如 果 <1limits.h> 中 定义 了 常量 PATH _MAX， 那 么 就 没有 任何 问题 ; 如 果 未 定义 ， 则 需 调 用 
pathconf. Kl pathcont 的 返回 值 是 基于 工作 目录 的 相对 路 径 名 的 最 大 长 度 ， 而 工作 目录 是 
其 第 一 个 参数 ， 所 以 ， 指 定 根 目 录 为 第 一 个 参数 ， 并 将 得 到 的 返回 值 加 1 作为 结果 值 。 如 果 
pathconf 指明 PATH MAX 是 不 确定 的 ， 那 么 我 们 就 只 能 猜测 某 个 值 。 

对 于 PATH MAX 是 否 考虑 到 在 路 径 名 末尾 有 一 个 null 字 节 这 一 点 ，2001 年 以 前 的 POSIX.1 
版 本 表述 得 并 不 清楚 。 出 于 安全 方面 的 考虑 ， 如 果 操 作 系 统 的 实现 符合 某 个 先前 版 本 的 标准 ， 但 
并 不 符合 Single UNIX Specification 的 任何 版 本 (SUS 明确 要 求 在 结尾 处 加 一 个 终止 null 字 节 )， 
则 需要 在 为 路 径 名 分 配 的 存储 量 上 加 1。 

处 理 不 确定 结果 情况 的 正确 方法 与 如 何 使 用 分 配 的 存储 空间 有 关 。 例 如 , 如 果 我 们 为 getcwd 
调用 分 配 存 储 空间 (返回 当前 工作 目录 的 绝对 路 径 名 ， 见 4.23 节 )， 但 分 配 到 的 空间 太 小 ， 则 会 
返回 一 个 错误 ， 并 将 errno 设置 为 ERANGE。 然 后 可 调用 realloc 来 增加 分 配 的 空间 CH 7.8 
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节 和 习题 4.160 并 重 试 。 不 断 重 复 此 操作 ， 直 到 getcwd 调用 成 功 执行 。 

2. 最 大 打开 文件 数 

守护 进程 (daemon process， 在 后 台 运 行 且 不 与 终端 相连 接 的 一 种 进程 ) 中 一 个 常见 的 代码 序 
列 是 关闭 所 有 打开 文件 。 某 些 程序 中 有 下 列 形式 的 代码 序列 ， 这 段 程 序 假定 在 <sys/Param.h> 
头 文件 中 定义 了 常量 NOFILE. 


#include <sys/param.h>; 


for (i = 0; i « NOFILE; i++) 
close (i); 


另外 一 些 程序 则 使 用 某 些 <stdio .h> 版 本 提供 的 作为 上 限 的 常量 NFILE。 某 些 程序 则 直接 将 其 
上 限 值 便 编 码 为 20。 但 是 ， 这 些 方法 都 不 是 可 移植 的 。 

我 们 希望 用 POSIX.1 的 OPEN MAX 确定 此 值 以 提高 可 移植 性 , 但 是 如 果 此 值 是 不 确定 的 ， 则 
仍然 有 问题 ， 如 果 我 们 编写 下 列 代码 : 


#include <unistd.h> 


for (i = 0; i < sysconf( SC OPEN MAX); i++) 
close (i); 


如 果 OPEN MAX 是 不 确定 的 ， 那 么 for 循环 根本 不 会 执行 ， 因 为 sysconf 将 返回 -1。 在 这 种 情 
况 下 ， 最 好 的 选择 就 是 关闭 所 有 描述 符 直至 某 个 限制 值 ( 如 256)。 如 同上 面 的 路 径 名 实例 一 样 ， 
虽然 并 不 能 保证 在 所 有 情况 下 都 能 正确 工作 , 但 这 却 是 我 们 所 能 选择 的 最 好 方法 。 图 2-17 的 程序 
中 使 用 了 这 种 技术 。 

我 们 可 以 耐心 地 调用 close， 直 至 得 到 一 个 出 错 返 回 ， 但 是 从 close (EBADF) 出 错 返 回 
并 不 区 分 无 效 描述 符 和 没有 打开 的 描述 符 。 如 果 使 用 此 技术 ， 而 且 描 述 符 9 未 打开 ， 描 述 符 10 
打开 了 ， 那 么 将 停止 在 9 上 ， 而 不 会 关闭 10. dup 函数 〈 见 3.12 节 ) 在 超过 了 OPEN MAX 时 确 
实 会 返回 一 个 特定 的 出 错 值 ， 但 是 用 复制 一 个 描述 符 两 、 三 百 次 的 方法 来 确定 此 值 是 一 种 非常 极 








#include "apue.h" 
#include <errno.h> 
#include <limits.h> 


#ifdef OPEN MAX 

static long openmax - OPEN MAX; 
#else 

static long openmax = 0; 

tendif 


/* 

* If OPEN MAX is indeterminate, this might be inadequate. 
kf 

#define OPEN MAX GUESS 256 


long 
open max (void) 
{ 
if (openmax == 0) { /* first time through */ 
errno = 0; 
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if ((openmax = sysconf( SC OPEN MAX)) < 0) { 
if (errno == Q0) 
openmax = OPEN MAX GUESS; /* it's indeterminate */ 
else 
err sys("sysconf error for SC OPEN MAX"); 
) 
} 


return (openmax) ; 





图 2-17 确定 文件 描述 符 个 数 
某 些 实现 返回 LONG_MAX 作为 限制 值 ， 但 这 与 不 限制 其 值 在 效果 上 是 相同 的 。Linux 对 
ATEXIT MAX 所 取 的 限制 值 就 属于 此 种 情况 ( 见 图 2-15)， 这 将 使 程序 的 运行 行为 变 得 非常 糟糕 ， 
因此 并 不 是 一 个 好 方法 。 
例如 ， 我 们 可 以 使 用 Bourne-again shell 的 内 建 命 令 ulimit 来 更 改进 程 可 同时 打开 文件 
的 最 多 个 数 。 如 果 要 将 此 限制 值 设置 为 在 效果 上 是 无 限制 的 ， 那 么 通常 要 求 具有 特权 (超级 
用 户 )。 但 是 ， 一 旦 将 其 值 设置 为 无 穷 大 ，sysconf 就 会 将 LONG_MAX 作为 OPEN_MAX 的 限 
制 值 报告 。 程 序 车 将 此 值 作为 要 关闭 的 文件 描述 符 数 的 上 限 (如 图 2-17 Bras), 那么 为 了 试图 
关闭 2 147 483 647 个 文件 描述 符 ， 就 会 浪费 大 量 时 间 ， 实 际 上 其 中 绝 大 多 数 文件 描述 符 并 未 
得 到 使 用 。 
支持 Single UNIX Specification 中 XSI 扩展 的 系统 提供 了 getrlimit(2) 函 数 〈 见 7.11 节 )。 
它 返 回 一 个 进程 可 以 同时 打开 的 描述 符 的 最 多 个 数 。 使 用 该 函数 ， 我 们 能 够 检测 出 对 于 进程 能 够 
打开 的 文件 数 实 际 上 并 没有 设置 上 限 ， 于 是 也 就 避 开 了 这 个 问题 。 
OPEN MAX 被 POSIX 称 为 运行 时 不 变 值 ， 这 意味 着 在 一 个 进程 的 生命 周期 中 其 值 不 应 发 生 
变化 。 但 是 在 支持 XSI 扩展 的 系统 上 ， 可 以 调用 setrlimit(2) 函 数 ( 见 7.11 节 ) 更 改 一 个 运 
行进 程 的 OPEN MAX 值 (也 可 用 C shell 的 limit X Bourne shell, Bourne-again shell, Debian 
Almquist 和 Korn shell 的 ulimit 命令 更 改 这 个 值 )。 如 果 系统 支持 这 种 功能 , 则 可 以 更 改 图 2-17 
中 的 函数 ， 使 得 每 次 调用 此 函数 时 都 会 调用 sysconf， 而 不 只 是 在 第 一 次 调用 此 函数 时 调用 


sysconf, 


2.6 选项 


图 2-5 列 出 了 POSIX.1 的 选项 ， 并 且 2.2.3 节 讨 论 了 XSI 的 选项 组 。 如 果 我 们 要 编写 可 移植 
的 应 用 程序 ， 而 这 些 程序 可 能 会 依赖 于 这 些 可 选 的 支持 的 功能 ， 那 么 就 需要 一 种 可 移植 的 方法 来 
判断 实现 是 否 支 持 一 个 给 定 的 选项 。 

如 同 对 限制 的 处 理 ( 见 2.5 节 ) 一 样 ，POSIX.1 定义 了 3 种 处 理 选项 的 方法 。 

(1) 编译 时 选项 定义 在 <unistd.h> 中 。 

(2) 与 文件 或 目录 无 关 的 运行 时 选项 用 sysconf 函数 来 判断 。 

(3) 与 文件 或 目录 有 关 的 运行 时 选项 通过 调用 pathconf 或 fpathconf 函数 来 判断 。 

选项 包括 了 图 2-5 中 第 3 列 的 符号 以 及 图 2-19 和 图 2-18 中 的 符号 。 如 果 符 号 常量 未 定义 ， 则 必 
须 使 用 sysconf. pathconf 或 fpathconf 来 判断 是 否 支 持 该 选项 。 在 这 种 情况 下 ， 这 些 函 数 的 
name 参数 前 级 POSIX 必须 替换 为 _SC 或 PC。 对 于 以 _XOPEN 为 前 缀 的 常量 ， 在 构成 name 参数 时 
必须 在 其 前 放置 sc 或 Pc。 例 如， 若 常 量 POSIX RAW THREADS 是 未 定义 的 ， 那 么 就 可 以 将 name 
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参数 设置 为 SC_RAW_THREADS， 并 以 此 调用 syscont 来 判断 该 : 


台 是 否 支 持 POSIX 线程 选项 。 如 


若 常 量 XOPEN_UNIX 是 未 定义 的 ， 那 么 就 可 以 将 name 参数 设置 为 _ SC_XOPEN_UNIX， 并 以 此 调用 
sysconf 来 判断 该 平台 是 否 支 持 XSI 扩展 。 
对 于 每 一 个 选项 ， 有 以 下 3 种 可 能 的 平台 支持 状态 。 
CD 如 果 符 号 常量 没有 定义 或 者 定义 值 为 一 1， 那 么 该 平台 在 编译 时 并 不 支持 相应 选项 。 但 是 
有 一 种 可 能 , 即 在 已 支持 该 选项 的 新 系统 上 运行 老 的 应 用 时 , 即使 该 选项 在 应 用 编译 时 未 被 支持 ， 
但 如 今 新 系统 运行 时 检查 会 显示 该 选项 已 被 文 持 。 
(2) 如 果 符 号 常量 的 定义 值 大 于 0， 那 么 该 平台 支持 相应 选项 。 
(3) 如 果 符 号 常量 的 定义 值 为 0， 则 必须 调用 sysconf. pathconf 或 fpathconf 来 判断 


相应 选项 是 否 受到 支持 。 


图 2-18 总 结 了 pathconf 和 fpathconf 使 用 的 符号 常量 。 除 了 图 2-5 中 列 出 的 选项 之 外 ， 
图 2-19 总 结 了 其 他 一 些 sysconf 使 用 的 未 弃 用 的 选项 及 它们 的 符号 和 常量。 注意 ， 我 们 省 略 了 与 


实用 命令 相关 的 选项 。 





_POSIX_CHOWN_RESTRICTED | 使 用 chown 是 否 是 受 限 的 
_POSIX_NO_TRUNC 路 径 名 长 于 NAME_MRX 是 否 出 错 
_POSIX_VDISABLE 若 定义 ， 可 用 此 值 禁用 终端 特殊 字符 


_PC_CHOWN_RESTRICTED 
_PC_NO_TRUNC 
_PC_VDISRBLE 


_POSIX_ASYNC_IO 对 相关 联 的 文件 是 否 可 以 使 用 异步 VO _PC_ASYNC_IO 
_POSIX_PRIO_IO 对 相关 联 的 文件 是 否 可 以 使 用 优先 的 UO | PC PRIO IO 
_POSIX_SYNC_IO 对 相关 联 的 文件 是 否 可 以 使 用 同步 VO _PC_SYNC_IO 
_POSIX2_SYMLINKS 目录 中 是 否 支 持 符号 链接 


图 2-18 pathconf 和 fpathconf 的 选项 及 name 参数 





.POSIX ASYNCHRONOUS IO 
.POSIX BARRIERS 
.POSIX CLOCK SELECTION 
.POSIX JOB CONTROL 

.POSIX MAPPED FILES 

.POSIX MEMORY PROTECTION 
POSIX READER WRITER LOCKS 
POSIX REALTIME SIGNALS 


.POSIX SAVED IDS 


POSIX SEMAPHORES 
POSIX SHELL 
POSIX SPIN LOCKS 

POSIX THREAD SAFE FUNCTIONS 
POSIX THREADS 


.POSIX TIMEOUTS 


.POSIX TIMERS 
.POSIX VERSION 


_XOPEN_CRYPT 


此 实现 是 否 支 持 POSIX 异 步 JO 

此 实现 是 否 支持 屏障 

此 实现 是 否 支持 时 钟 选择 

此 实现 是 否 支持 作业 控制 

此 实现 是 否 支 持 存储 映像 文件 

此 实现 是 否 支持 存储 保护 

此 实现 是 否 支 持 读者 - 写 者 锁 

此 实现 是 否 支持 实时 信号 

此 实现 是 否 支持 保存 的 设置 
用 户 ID 和 保存 的 设置 组 ID 

此 实现 是 否 支持 POSIX 信号 量 

此 实现 是 否 支持 POSIX shell 

此 实现 是 否 支持 旋转 锁 

此 实现 是 否 支持 线程 安全 函数 

此 实现 是 否 支持 线程 

此 实现 是 否 支持 基于 超时 的 
变量 选择 函数 

此 实现 是 否 支持 定时 器 
POSIX.1 版 本 

此 实现 是 否 支持 XSI 加 密 可 
选 组 





.PC 2 SYMLINKS 


.SC ASYNCHRONOUS IO 
.SC BARRIERS 

.SC CLOCK SELECTION 

.SC JOB CONTROL 

.SC MAPPED FILES 

.SC MEMORY PROTECTION 
.SC READER WRITER LOCKS 
.SC REALTIME SIGNALS 


.SC SAVED IDS 


.SC SEMAPHORES 

.SC SHELL 

.SC SPIN LOCKS 

.SC THREAD SAFE FUNCTIONS 
.SC THREADS 


SC TIMEOUTS 


.SC TIMERS 
.SC VERSION 


.SC XOPEN CRYPT 
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SVT E EB 
 XOPEN REALTIME S SES XSI 实时 选 _SC_XOPEN_REALTIME 


3r ZEE dg i 
.XOPEN REALTIME THREADS P gs 否 支 持 实时 线程 先 .SC XOPEN REALTIME THREADS 


此 实现 是 否 支 持 XSI 共享 存 
储 选项 组 _SC_XOPEN_SHM 


_XOPEN_VERSION XSI 版 本 _SC_XOPEN_VERSION 
图 2-19 sysconf 的 选项 及 name FR 

如 同系 统 限制 一 样 , 关于 sysconf. pathconf 和 fpathconf 如 何 处 理 选 项 ， 有 如 下 几 点 
值得 注意 。 

(1) SC VERSION 的 返回 值 表 示 标 准 发 布 的 年 (以 4 位 数 表示 )、 月 (以 2 位 数 表 示 )。 
该 值 可 能 是 198808L、199009L、199506L 或 表示 该 标准 后 续 版 本 的 其 他 值 。 与 SUSv3 
(POSIX.1 2001 年 版 ) 相关 连 的 值 是 200112L, 45 SUSv4 (POSIX.1 2008 年 版 ) 相关 连 的 值 
是 200809L。 

(2) SC XOPEN VERSION 的 返回 值 表示 系统 支持 的 XSI 版 本 .与 SUSv3 相关 联 的 值 是 600, 
与 SUSv4 相关 的 值 是 700。 

(3) SC JOB CONTROL. SC SAVED IDS 以 及 _PC_VDISABLE 的 值 不 再 表示 可 选 功能 。 
虽然 XPG4 和 SUS 早期 版 本 要 求 支持 这 些 选项 ， 但 从 SUSv3 起 ， 不 再 需要 这 些 功 能 ， 但 这 些 符 
号 仍然 被 保留 ， 以 便 向 后 兼容 。 

(4) 符合 POSIX.1-2008 的 平台 还 要 求 支 持 下 列 选项 : 

e POSIX ASYNCHRONOUS IO 

e POSIX BARRIERS 

e POSIX CLOCK SELECTION 

e POSIX MAPPED FILES 

e — POSIX MEMORY PROTECTION 

e POSIX READER WRITER LOCKS 

e POSIX REALTIME SIGNALS 

e — POSIX SEMAPHORES 

e — POSIX SPIN LOCKS 

e — POSIX THREAD SAFE FUNCTIONS 

e POSIX THREADS 

e — POSIX TIMEOUTS 

e — POSIX TIMERS 

这 些 常量 定义 成 有 具有 值 200809L。 相 应 的 _sc 符号 同样 是 为 了 向 后 兼容 而 被 保留 下 来 的 。 

(5) 如 果 对 指定 的 pathname 或 fd 已 不 再 支持 此 功能 ， 那 么 PC CHOWN RESTRICTED 和 
_PC_NO_TRUNC 返回 -1， 而 errno 不 变 ， 在 所 有 符合 POSIX 的 系统 中 ， 返 回 值 将 大 于 0. eas 
该 选项 被 支持 ); 

(6) PC CHOWN RESTRICT 引用 的 文件 必须 是 一 个 文件 或 者 是 一 个 目录 。 如 果 是 一 个 目录 ， 
那么 返回 值 指 明 该 选项 是 否 可 应 用 于 该 目录 中 的 各 个 文件 。 

(7) _PC_NO_TRUNC 和 _PC_2_SYMLINKS 引用 的 文件 必须 是 一 个 目录 。 

(8) PC NO TRUNC 的 返回 值 可 用 于 目录 中 的 各 个 文件 名 。 


_XOPEN_SHM 
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34 (9) _PC_VDISABLE 引用 的 文件 必须 是 一 个 终端 文件 。 
(10) _PC_ASYNC_IO, _PC_PRIO_IO 和 _PC_SYNC_IO 引用 的 文件 一 定 不 能 是 一 个 目录 。 
图 2-20 列 出 了 若干 配置 选项 以 及 在 本 书 所 讨论 的 4 个 示例 系统 上 的 对 应 值 。 如 果 系 统 定 
义 了 某 个 符号 常量 但 它 的 值 为 -1 或 0, 但 是 相应 的 sysconf 或 pathconf 调用 返回 的 是 -1， 
就 表示 该 项 未 被 支持 。 可 以 看 到 ， 有 些 系统 实现 还 没有 跟 上 Single UNIX Specification 的 最 新 


版 本 。 
UFS 文件 系统 | PCFS SOEs ee 





.POSIX CHOWN RESTRICTED 


.POSIX JOB CONTROL 200112 1 
_POSIX_NO_TRUNC 200112 不 支持 


_POSIX_SAVED_IDS M 200112 1 

_POSIX_THREADS 200112 200112 200112 

.POSIX VDISABLE 255 255 0 

POSIX VERSION 200112 200809 200112 200112 200112 

 XOPEN UNIX 不 支持 1 1 1 1 

_XOPEN_VERSION 不 支持 700 600 600 600 

图 2-20 配置 选项 的 实例 

注意 ， 当 用 于 Solaris PCFS 文件 系统 中 的 文件 时 ， 对 于 _PC_NO_TRUNC，Ppathconf 返回 -1。 
PCFS 文件 系统 支持 DOS 格式 (软盘 格式 )，DOS 文件 名 按 DOS 文件 系统 所 要 求 8.3 格式 截断 ， 
在 进行 此 种 操作 时 并 无 任何 提示 。 


2.7 ”功能 测试 宏 


如 前 所 述 ， 头 文件 定义 了 很 多 POSIX.1 和 XSI 符 号。 但 是 除了 POSIX.1 和 XSI 定义 外 ,大 

多 数 实现 在 这 些 头 文件 中 也 加 入 了 它们 自己 的 定义 ,如果 在 编译 一 个 程序 时 ,希望 它 只 与 POSIX 
的 定义 相关 ， 而 不 与 任何 实现 定义 的 常量 冲突 ， 那 么 就 需要 定义 常量 POSIX C SOURCE. 
- 旦 定义 了 _POSIX_C_SOURCE, 所 有 POSIX.1 头 文件 都 使 用 此 常量 来 排除 任何 实现 专 有 的 





POSIX.1 标准 的 早期 版 本 定义 了 _POSIX_SOURCE 常量 。 在 POSIX.1 的 2001 版 中 ， 它 被 替换 
为 POSIX C SOURCE, 


常量 POSIX C SOURCE À XOPEN SOURCE 被 称 为 功能 测试 宏 〈feature test macro)。 所 有 
功能 测试 宏 都 以 下 划 线 开始 。 当 要 使 用 它们 时 ， 通 常 在 cc 命令 行 中 以 下 列 方式 定义 : 

cc -D POSIX C SOURCE=200809L file.c 
这 使 得 C 程序 在 包括 任何 头 文 件 之 前 ， 定 义 了 功能 测试 宏 。 如 果 我 们 仅 想 使 用 POSIX.1 定义 ， 那 
么 也 可 将 源 文件 的 第 一 行 设置 为 : 

#define POSIX C SOURCE 200809L 

为 使 SUSv4 的 XSI 选项 可 由 应 用 程序 使 用 ， 需 将 常量 XOPEN_SOURCE 定义 为 700。 除 了 让 
XSI 选项 可 用 以 外 ， 就 POSIX.1 的 功能 而 言 ， 这 与 将 _ POSIX_C_SOURCE 定义 为 200809L 的 作用 
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相同 。 
SUS 将 c99 实用 程序 定义 为 C 编译 环境 的 接口 。 随 之 ， 就 可 以 用 如 下 方式 编译 文件 : 
c99 -D XOPEN SOURCE-700 file.c -o file 

可 以 使 用 -std=c99 选项 在 gcc If] C 编译 器 中 启用 1999 ISO C 扩展 ， 如 下 所 示 : 


gcc -D XOPEN SOURCE-700 -std-c99 file.c -o file 


2.8 ”基本 系统 数据 类 型 


历史 上 ， 某 些 UNIX 系统 变量 已 与 某 些 C 数据 类 型 联系 在 一 起 ， 例 如 ， 历 史上 主 、 次 设备 号 
存放 在 一 个 16 位 的 短 整 型 中 ，8 位 表示 主 设备 号 ， 另 外 8 位 表示 次 设备 号 。 但 是 ， 很 多 较 大 的 系 
统 需 要 用 多 于 256 个 值 来 表示 其 设备 号 ， 于 是 ， 就 需要 一 种 不 同 的 技术 。( 实 际 上 ，Solaris 用 32 
位 表示 设备 号 : 14 位 用 于 主 设备 号 ，18 位 用 于 次 设备 号 。) 

头 文件 <sys/types .h> 中 定义 了 某 些 与 实现 有 关 的 数据 类 型 ， 它 们 被 称 为 基本 系统 数据 类 
型 (primitive system data type)。 还 有 很 多 这 种 数据 类 型 定义 在 其 他 头 文件 中 。 在 头 文件 中 ， 这 些 
数据 类 型 都 是 用 C 的 typedef 来 定义 的 。 它 们 绝 大 多 数 都 以 上 结尾 。 图 2-21 列 出 了 本 书 将 使 
用 的 一 些 基本 系统 数据 类 型 。 

用 这 种 方式 定义 了 这 些 数据 类 型 后 ， 就 不 再 需要 考虑 因 系 统 不 同 而 变化 的 程序 实现 细节 。 在 
本 书 中 涉及 这 些 数 据 类 型 时 ， 我 们 会 说 明 为 什么 要 使 用 它们 。 


clock t 时 钟 滴答 计数 器 (进程 时 间 )(1.10 节 ) 

comp_t 压缩 的 时 钟 滴答 (POSIX.1 未 定义 ; 8.14 节 ) 
dev_t 设备 号 〈 主 和 次 ) (4.24 1) 

fd_set 文件 描述 符 集 (14.4.1 节 ) 

fpos 七 文件 位 置 (5.10 Fi) 

gid t 数值 组 ID 

ino t i 节点 编号 (4.14 节 ) 

mode_t 文件 类 型 ， 文 件 创建 模式 (4.5 节 ) 

nlink_t 目录 项 的 链接 计数 (4.14 节 ) 

off_t 文件 长 度 和 偏 移 量 〈 带 符号 的 ) Clseek, 3.6 节 ) 
pid_t 进程 ID 和 进程 组 ID〈 带 符号 的 ) (8.2 和 9.4 节 ) 
pthread t 线程 ID (11.3 节 ) 

ptrdiff_t 两 个 指针 相 减 的 结果 《〈 带 符号 的 ) 

rlimt 资源 限制 (7.11 节 ) 

sig atomic t E 原 子 性 地 访问 的 数据 类 型 (10.15 节 ) 
sigset_t 信号 集 (10.11 4) 

size_t WH WEF) KE 〈 不 带 符号 的 ) (3.7 节 ) 
ssize t 返回 字 节 计数 的 函数 〈 带 符号 的 ) Cread, write, 3.7 节 ) 
time t 日 历时 间 的 秒 计数 器 (1.10 节 ) 

uid_t 数值 用 户 ID 

wchar t 能 表示 所 有 不 同 的 字符 码 


图 2-21 一 些 常 用 的 基本 系统 数据 类 型 
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2.9 标准 之 间 的 冲突 


就 整体 而 言 ， 这 些 不 同 的 标准 之 间 配 合 得 相当 好 。 因 为 SUS 基本 说 明和 POSIX.1 是 同一 个 
东西 ， 所 以 我 们 不 对 它们 进行 特别 的 说 明 ， 我 们 主要 关注 ISO C 标准 和 POSIX.1 之 间 的 差别 。 它 
们 之 间 的 冲突 并 非 有 意 ， 但 如 果 出 现 冲突 ，POSIX.1 服从 ISO C 标准 。 然 而 它们 之 间 还 是 存在 着 
一 些 差 别 的 。 

ISO C 定义 了 clock 函数 , 它 返回 进程 使 用 的 CPU IY Ta], 返回 值 是 clock t 类 型 值 , 但 ISO 
C 标准 没有 规定 它 的 单位 。 为 了 将 此 值 变换 成 以 秒 为 单位 ， 需 要 将 其 除 以 在 <time .h> 头 文件 中 
定义 的 CLOCKS_PER_SEC。POSIX.1 定义 了 times 函数 ， 它 返回 其 调用 者 及 其 所 有 终止 子 进程 
的 CPU 时 间 以 及 时 钟 时 间 ， 所 有 这 些 值 都 是 clock t 类 型 值 。sysconf 函数 用 来 获得 每 秒 滴 
答 数 ， 用 于 表示 times 函数 的 返回 值 。ISO C 和 POSIX.1 用 同一 种 数据 类 型 (clock t) 来 保 
存 对 时 间 的 测量 ， 但 定义 了 不 同 的 单位 。 这 种 差别 可 以 在 Solaris 中 看 到 ， 其 中 clock 返回 微 秒 
数 (CLOCK PER SEC 是 100 J) ifj sysconf 为 每 秒 滴答 数 返 回 的 值 是 100。 因 此 ， 我 们 在 使 
用 clock t 类 型 变量 的 时 候 ， 必 须 十 分 小 心 以 免 混 淆 不 同 的 时 间 单 位 。 

另 一 个 可 能 产生 冲突 的 地 方 是 : 在 ISO C 标准 说 明 函 数 时 ， 可 能 没有 像 POSIX.1 那样 严 。 在 
POSIX 环境 下 ， 有 些 函 数 可 能 要 求 有 一 个 与 C 环境 下 不 同 的 实现 ， 因 为 POSIX 环境 中 有 多 个 进 
程 ， 而 ISO C 环境 则 很 少 考 虑 宿主 操作 系统 。 尽 管 如 此 ， 很 多 符合 POSIX 的 系统 为 了 兼容 性 
也 会 实现 ISO C 函数 。signal 函数 就 是 一 个 例子 。 如 果 在 不 了 解 的 情况 下 使 用 了 Solaris 提 
ftf] signal 函数 (希望 编写 可 在 ISO C 环境 和 较 早 UNIX 系统 中 运行 的 可 兼容 程序 ) ， 那 
么 它 提供 了 与 POSIX.1 sigaction 函数 不 同 的 语义 .第 10 章 将 对 signal 函数 做 更 多 说 明 。 


2.10 小 结 


在 过 去 25 年 多 的 时 间 里 ，UNIX 编程 环境 的 标准 化 已 经 取得 了 很 大 进展 。 本 章 对 3 个 主要 标 
WE——ISO C. POSIX 和 Single UNIX Specification 进行 了 说 明 ， 也 分 析 了 这 些 标准 对 本 书 主 要 关 
注 的 4 个 实现 ， 即 FreeBSD、Linux、Mac OS X 和 Solaris 所 产生 的 影响 。 这 些 标准 都 试图 定义 一 
些 可 能 随 实现 而 更 改 的 参数 ， 但 是 我 们 已 经 看 到 这 些 限制 并 不 完美 。 本 书 将 涉及 很 多 这 些 限 制 和 


幻 常 量 。 
在 本 书 最 后 的 参考 书目 中 ， 说 明了 如 何 获得 这 些 标准 的 方法 。 
习题 


2.1 在 2.8 节 中 提 到 一 些 基 本 系统 数据 类 型 可 以 在 多 个 头 文件 中 定义 。 例 如 , 在 FreeBSD 8.0 中 ， 
size tt 在 29 个 不 同 的 头 文件 中 都 有 定义 。 由 于 一 个 程序 可 能 包含 这 29 个 不 同 的 头 文件 ， 
但 是 ISO C 却 不 允许 对 同一 个 名 字 进 行 多 次 typedef， 那 么 如 何 编写 这 些 头 文件 呢 ? 

22 “检查 系统 的 头 文件 ， 列 出 实现 基本 系统 数据 类 型 所 用 到 的 实际 数据 类 型 。 

23 ”改写 图 2-17 中 的 程序 ， 使 其 在 sysconf 为 OPEN MAX 限制 返回 LONG_MAX 时 ， 避 免 进 行 
不 必要 的 处 理 。 





3.1 引言 


本 章 开 始 讨 论 UNIX 系统 ， 先 说 明 可 用 的 文件 IO 函数 一 一 打开 文件 、 读 文件 、 写 文件 等 。 
UNIX 系统 中 的 大 多 数 文件 VO 只 需 用 到 $ 个 函数 : open. read. write. 1seek 以 及 close. 
然后 说 明 不 同 缓冲 长 度 对 read 和 write 函数 的 影响 。 

本 章 描述 的 函数 经 常 被 称 为 不 带 缓 冲 的 IO Cunbuffered UO， 与 将 在 第 5 章 中 说 明 的 标准 vo 
函数 相对 照 )。 术 语 不 带 缓冲 指 的 是 每 个 read 和 write 都 调用 内 核 中 的 一 个 系统 调用 。 这 些 不 
带 缓冲 的 VO 函数 不 是 ISO C 的 组 成 部 分 , 但 是 , 它们 是 POSIX.1 和 Single UNIX Specification 的 
组 成 部 分 。 

只 要 涉及 在 多 个 进程 间 共享 资源 ， 原 子 操作 的 概念 就 变 得 非常 重要 。 我 们 将 通过 文件 WO 和 open 
函数 的 参数 来 讨论 此 概念 。 然 后 ， 本 章 将 进一步 讨论 在 多 个 进程 间 如 何 共享 文件 ， 以 及 所 涉及 的 内 核 
有 关 数 据 结构 。 在 描述 了 这 些 特 征 后 ， 将 说 明 dup. fcntl. sync. fsync Ñl ioctl 函数 。 


3.2 文件 描述 符 


对 于 内 核 而 言 ， 所 有 打开 的 文件 都 通过 文件 描述 符 引 用 。 文 件 描述 符 是 一 个 非 负 整数 。 当 打 
开 一 个 现 有 文件 或 创建 一 个 新 文件 时 ， 内 核 向 进程 返回 一 个 文件 描述 符 。 当 读 、 写 一 个 文件 时 ， 
使 用 open 或 creat 返回 的 文件 描述 符 标识 该 文件 ， 将 其 作为 参数 传送 给 read XX write. 
按照 惯例 ，UNIX 系统 shell 把 文件 描述 符 0 与 进程 的 标准 输入 关联 ， 文 件 描述 符 1 与 标准 输 
出 关联 ,文件 描述 符 2 与 标准 错误 关联 。 这 是 各 种 shell 以 及 很 多 应 用 程序 使 用 的 惯例 ， 与 UNIX 
内 核 无 关 。 尽 管 如 此 ， 如 果 不 遵循 这 种 惯例 ， 很 多 UNIX 系统 应 用 程序 就 不 能 正常 工作 。 
在 符合 POSIX.1 的 应 用 程序 中 ， 约 数 0、1、2 虽然 已 被 标准 化 ， 但 应 当 把 它们 替换 成 符号 常 
量 STDIN FILENO, STDOUT FILENO 和 STDERR FILENO 以 提高 可 读 性 。 这 些 常量 都 在 头 文 
件 <unistd.h> 中 定义 。 
文件 描述 符 的 变化 范围 是 0— OPEN MAx-1 (JILE 2-11)。 早 期 的 UNIX 系统 实现 采用 的 上 限 
值 是 19〈 人 允许 每 个 进程 最 多 打开 20 个 文件 )， 但 现在 很 多 系统 将 其 上 限 值 增加 至 63. 
对 于 FreeBSD 8.0、Linux 3.2.0, Mac OS X 10.6.8 以 及 Solaris 10, 文件 描述 符 的 变化 范围 几乎 
是 无 限 的 ， 它 只 受到 系统 配置 的 存储 器 总 量 、 整 型 的 字 长 以 及 系统 管理 员 所 配置 的 软 限 制 和 硬 限 
制 的 约束 。 
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3.3 AŽ open 和 openat 


调用 open BK openat 函数 可 以 打开 或 创建 一 个 文件 。 
#include «fcntl.h» 


int open (const char *path, int oflag,... /* mode t mode */); 


int openat(int fd, const char *path, int oflag, ... /* mode t mode */ ); 
两 函数 的 返回 值 : 若 成 功 ， 返 回 文件 描述 符 ; 若 出 错 ， 返 回 -1 


我 们 将 最 后 一 个 参数 写 为 . . .，ISO C 用 这 种 方法 表明 余下 的 参数 的 数量 及 其 类 型 是 可 变 的 。 
对 于 open 函数 而 言 ， 仅 当 创 建新 文件 时 才 使 用 最 后 这 个 参数 〈 稍 后 将 对 此 进行 说 明 )。 在 函数 原 
型 中 将 此 参数 放置 在 注释 中 。 

Path 参数 是 要 打开 或 创建 文件 的 名 字 。oflag 参数 可 用 来 说 明 此 函数 的 多 个 选项 。 用 下 列 一 个 
或 多 个 常量 进行 “或 ”运算 构成 ofag 参数 〈 这 些 常量 在 头 文件 <fcnt1.h> 中 定义 )。 





O RDONLY 只 读 打 开 。 
O WRONLY 只 写 打 开 。 
O_RDWR 读 、 写 打开 。 
大 多 数 实现 将 0 RDONLY 定义 为 0，O_WRONLY 定义 为 1，O_RDWR 定义 为 2， 以 与 早期 
的 程序 兼容 。 
O EXEC 只 执行 打开 。 
O SEARCH 只 搜索 打开 (应 用 于 目录 )。 


O SEARCH 常量 的 目的 在 于 在 目录 打开 时 验证 它 的 搜索 权限 。 对 目录 的 文件 描述 符 的 后 续 操 
作 就 不 需要 再 次 检查 对 该 目录 的 搜索 权限 。 本 书 中 涉及 的 操作 系统 目前 都 没有 支持 O_SEARCH。 


在 这 5 个 常量 中 必须 指定 一 个 且 只 能 指定 一 个 。 下 列 常量 则 是 可 选 的 。 


O APPEND 每 次 写 时 都 追加 到 文件 的 尾 端 。3.11 节 将 详细 说 明 此 选项 。 

O CLOEXEC 把 FD CLOEXEC 常量 设置 为 文件 描述 符 标志 。3.14 节 中 将 说 明文 件 描 述 
符 标志 。 

O CREAT 若 此 文件 不 存在 则 创建 它 。 使 用 此 选项 时 ，open 函数 需 同 时 说 明 第 3 个 


参数 mode (openat 函数 需 说 明 第 4 个 参数 mode), 用 mode 指定 该 新 文 
件 的 访问 权限 位 (4.5 节 将 说 明文 件 的 权限 位 ， 那 时 就 能 了 解 如 何 指定 
mode， 以 及 如 何 用 进程 的 umask 值 修改 它 )。 

O DIRECTORY 如 果 path 引用 的 不 是 目录 ， 则 出 错 。 

O EXCL 如 果 同 时 指定 了 oO_CRERAT， 而 文件 已 经 存在 ， 则 出 错 。 用 此 可 以 测试 一 
个 文件 是 否 存在 ， 如 果 不 存在 ， 则 创建 此 文件 ， 这 使 测试 和 创建 两 者 成 
为 一 个 原子 操作 。3.11 节 将 更 详细 地 说 明 原 子 操作 。 

O NOCTTY 如 果 path 引用 的 是 终端 设备 , 则 不 将 该 设备 分 配 作为 此 进程 的 控制 终端 。 
9.6 节 将 说 明 控 制 终端 。 

O NOFOLLOW 如 果 path 引用 的 是 一 个 符号 链接 ， 则 出 错 。4.17 节 将 说 明 符 号 链接 。 

O NONBLOCK 如 果 path 引用 的 是 一 个 FIFO、 一 个 块 特殊 文件 或 一 个 字符 特殊 文件 ， 则 
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此 选项 为 文件 的 本 次 打开 操作 和 后 续 的 VO 操作 设置 非 阻塞 方式 。14.2 节 
将 说 明 此 工作 模式 。 
较 早 的 System V 引入 了 O NDELAY (不 延迟 ) 标志 ， 它 与 O0 NONBLOCK (不 阻塞 ) 选 
项 类 似 ,但 它 的 读 操作 返回 值 具有 二 义 性 。 如 果 不 能 从 管道 、FIFO 或 设备 读 得 数据 ， 则 不 延 
Rik ME read 返回 0， 这 与 表示 已 读 到 文件 尾 端 的 返回 值 0 冲突 。 基 于 SVR4 的 系统 仍 支 
持 这 种 语义 的 不 延迟 选项 ， 但 是 新 的 应 用 程序 应 当 使 用 不 阻塞 选项 代替 之 。 





O SYNC 使 每 次 write 等 待 物 理 VO 操作 完成 , 包括 由 该 write 操作 引起 的 文件 
属性 更 新 所 需 的 UO。3.14 节 将 使 用 此 选项 。 
O TRUNC 如 果 此 文件 存在 ， 而 且 为 只 写 或 读 -写成 功 打 开 ， 则 将 其 长 度 截 断 为 0。 


O TTY INIT 如 果 打 开 一 个 还 未 打开 的 终端 设备 ， 设 置 非 标准 termios 参数 值 ， 使 其 
符合 Single UNIX Specification。 第 18 章 将 讨论 终端 IO 的 termios 结构 。 
下 面 两 个 标志 也 是 可 选 的 。 它 们 是 Single UNIX Specification (以 及 POSIX.1) 中 同步 输入 和 
输出 选项 的 一 部 分 。 
O DSYNC 使 每 次 write 要 等 待 物理 VO 操作 完成 ， 但 是 如 果 该 写 操作 并 不 影响 读 
取 刚 写 入 的 数据 ， 则 不 需 等 待 文件 属性 被 更 新 。 


O_DSYNC 和 0_SYNC 标志 有 微妙 的 区 别 。 仅 当 文 件 属性 需要 更 新 以 反映 文件 数据 变化 
(例如 ,更 新 文件 大 小 以 反映 文件 中 包含 了 更 多 的 数据 ) 时 ，O_DSYNC 标志 才 影 响 文件 属 性 。 
而 设置 0_SYNC 标志 后 ， 数 据 和 属性 总 是 同步 更 新 。 当 文件 用 O_DSYN 标志 打开 ， 在 重 写 其 
现 有 的 部 分 内 容 时 ， 文件 时 间 属 性 不 会 同步 更 新 。 与 此 相反 ， 如 果 文件 是 用 O_SYNC 标志 打 
开 ， 那 么 对 该 文件 的 每 一 次 write 都 将 在 write 返回 前 更 新 文件 时 间 ， 这 与 是 否 改 写 现 有 
字 节 或 追加 写 文件 无 关 。 


O_RSYNC 使 每 一 个 以 文件 描述 符 作 为 参数 进行 的 read 操作 等 待 , 直至 所 有 对 文件 
同一 部 分 挂 起 的 写 操作 都 完成 。 


Solaris 10 支持 所 有 这 3 个 标志 。FreeBSD (和 Mac OS X) 设置 了 另外 一 个 标志 
( O_FSYNC )， 它 与 标志 O_SYNC 的 作用 相同 。 因 为 这 两 个 标志 是 等 效 的 ， 它 们 定义 的 标志 具 
有 相同 的 值 ,FreeBSD 8.0 不 支持 O_DSYNC 或 0 RSYNC 标志 。Mac OS X 并 不 支持 O_RSYNC， 
但 却 定义 了 0_DSYNC， 处 理 O DSYNC 与 处 理 O_SYNC 相同 。Linux 3.2.0 定义 了 O_DSYNC, 
但 处 理 O RSYNC 与 处 理 O_SYNC 相同 。 


H open 和 openat 函数 返回 的 文件 描述 符 一 定 是 最 小 的 未 用 描述 符 数值 。 这 一 点 被 某 些 应 
用 程序 用 来 在 标准 输入 、 标 准 输出 或 标准 错误 上 打开 新 的 文件 。 例 如 ， 一 个 应 用 程序 可 以 先 关 闭 
标准 输出 〈 通 常 是 文件 描述 符 1)， 然 后 打开 另 一 个 文件 ， 执 行 打开 操作 前 就 能 了 解 到 该 文件 一 定 
会 在 文件 描述 符 1 上 打开 。 在 3.12 节 说 明 dup2 函数 时 ， 可 以 了 解 到 有 更 好 的 方法 来 保证 在 一 个 
给 定 的 描述 符 上 打开 一 个 文件 。 

fd BRGE open 和 openat 函数 区 分 开 ， 共 有 3 种 可 能 性 。 

(1) path 参数 指定 的 是 绝对 路 径 名 ， 在 这 种 情况 下 ， 应 参数 被 忽略 ，openat 函数 就 相当 于 
open PAM. 

(2) path 参数 指定 的 是 相对 路 径 名 ，f4 ARI THRA EFRA P oak. fd 
参数 是 通过 打开 相对 路 径 名 所 在 的 目录 来 获取 。 
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(3) path 参数 指定 了 相对 路 径 名 ， 应 参数 具有 特殊 值 RAT_FDCWD。 在 这 种 情况 下 ， 路 径 名 在 
当前 工作 目录 中 获取 ，openat 函数 在 操作 上 与 open 函数 类 似 。 

openat 函数 是 POSIX.1 最 新 版 本 中 新 增 的 一 类 函数 之 一 ， 希 望 解决 两 个 问题 。 第 一 ， 让 线 
程 可 以 使 用 相对 路 径 名 打开 目录 中 的 文件 ， 而 不 再 只 能 打开 当前 工作 目录 。 在 第 11 章 我 们 会 看 
到 ， 同 一 进程 中 的 所 有 线程 共享 相同 的 当前 工作 目录 ， 因 此 很 难 让 同一 进程 的 多 个 不 同 线程 在 同 
一 时 间 工 作 在 不 同 的 目录 中 。 第 二 ， 可 以 避免 time-of-check-to-time-of-use (TOCTTOU) 错误 。 

TOCTTOU 错误 的 基本 思想 是 : 如 果 有 两 个 基于 文件 的 函数 调用 ， 其 中 第 二 个 调用 依赖 于 第 
一 个 调用 的 结果 ， 那 么 程序 是 脆弱 的 。 因 为 两 个 调用 并 不 是 原子 操作 ， 在 两 个 函数 调用 之 间 文 件 
可 能 改变 了 ， 这 样 也 就 造成 了 第 一 个 调用 的 结果 就 不 再 有 效 ， 使 得 程序 最 终 的 结果 是 错误 的 。 文 
件 系统 命名 空间 中 的 TOCTTOU 错误 通常 处 理 的 就 是 那些 颠覆 文件 系统 权限 的 小 把 戏 ， 这 些小 把 
戏 通 过 骗取 特权 程序 降低 特权 文件 的 权限 控制 或 者 让 特权 文件 打开 一 个 安全 漏洞 等 方式 进行 。 
Wei 和 Pu[2005] 在 UNIX 文件 系统 接口 中 讨论 了 TOCTTOU 的 缺陷 。 

文件 名 和 路 径 名 截断 

如 果 NAME_MAX 是 14， 而 我 们 却 试图 在 当前 目录 中 创建 一 个 文件 名 包含 15 个 字符 的 新 文件 ， 此 时 
会 发 生 什 么 呢 ? 按照 传统 ， 早 期 的 System V 版 本 CI SVR2) 允许 这 种 使 用 方法 ， 但 总 是 将 文件 名 截断 
为 14 个 字符 ， 而 且 不 给 出 任何 信息 ， 而 BSD 类 的 系统 则 返回 出 错 状 态 ， 并 将 errno 设置 为 
ENAMETOOLONG. 无 声 无 息 地 截断 文件 名 会 引起 问题 , 而 且 它 不 仅仅 影响 到 创建 新 文件 。 如 果 NAME MAX 
是 14, 而 存在 一 个 文件 名 恰好 就 是 14 个 字符 的 文件 , 那么 以 路 径 名 作为 其 参数 的 任 一 函数 Copen, stat 
等 ) 都 无 法 确定 该 文件 的 原始 名 是 什么 。 其 原因 是 这 些 函 数 无 法 判断 该 文件 名 是 否 被 截断 过 。 

在 POSIX.1 中 , 常量 POSIX NO TRUNC 决定 是 要 截断 过 长 的 文件 名 或 路 径 名 ， 还 是 返回 一 个 
出 错 。 正 如 我 们 在 第 2 章 中 已 经 见 过 的 ， 根 据 文件 系统 的 类 型 ， 此 值 可 以 变化 。 我 们 可 以 用 
fpathconf 或 pathconf 来 查询 目录 具体 支持 何 种 行为 , 到 底 是 截断 过 长 的 文件 名 还 是 返回 出 错 。 

是 否 返回 一 个 出 错 值 在 很 大 程度 上 是 历史 形成 的 。 例 如 。 基 于 SVR4 的 系统 对 传统 的 System V 
文件 系统 (SS) 并 不 出 错 ， 但 是 它 对 BSD 风格 的 文件 系统 ( UFS ) 则 出 错 。 作 为 另 一 个 例子 CA 
见 图 2-20), Solaris 对 UFS 返回 出 错 ， 对 与 DOS 兼容 的 文件 系统 PCFS 则 不 返回 出 错 ， 其 原因 是 
DOS 会 无 声 无 息 地 截断 不 匹配 8.3 格式 的 文件 名 。BSD 类 系统 和 Linux 总 是 会 返回 出 错 。 


di PoSIX_NO_TRUNC 有 效 ， 则 在 整个 路 径 名 超过 PATH_MAX， 或 路 径 名 中 的 任 一 文件 名 超 
过 NAME MAX 时， 出错 返 回 ， 并 将 errno 设置 为 ENAMETOOLONG。 


大 多 数 的 现代 文件 系统 支持 文件 名 的 最 大 长 度 可 以 为 255。 因 为 文件 名 通常 比 这 个 限制 要 短 ， 
因此 对 大 多 数 应 用 程序 来 说 这 个 限制 还 未 出 现 什么 问题 。 


3.4 BAX creat 


也 可 调用 creat 函数 创建 一 个 新 文件 。 


#include «fcntl.h» 
int creat(const char *path, mode t mode); 
返回 值 : 若 成 功 ， 返 回 为 只 写 打 开 的 文件 描述 符 ; 着 出 错 ， 返 回 -1 


注意 ， 此 函数 等 效 于 : 
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open (path, O WRONLY |O CREAT|O TRUNC, mode); 


在 早期 的 UNIX 系统 版 本 中 ，open 的 第 二 个 参数 只 能 是 0、1 或 2。 无 法 打开 一 个 尚未 存在 
的 文件 ， 因 此 需要 另 一 个 系统 调用 creat 以 创建 新 文件 。 现在 ，open 函数 提供 了 选项 O_CREAT 
和 0O_TRUNC， 于 是 也 就 不 再 需要 单独 的 creat BK. 
在 4.5 节 中 ， 我 们 将 详细 说 明文 件 访问 权限 ， 并 说 明 如 何 指定 mode. 
creat 的 一 个 不 足 之 处 是 它 以 只 写 方式 打开 所 创建 的 文件 。 在 提供 open 的 新 版 本 之 前 ， 如 
果 要 创建 一 个 临时 文件 ， 并 要 先 写 该 文件 ， 然 后 又 读 该 文件 ， 则 必须 先 调用 creat. close. A 
后 再 调用 open。 现 在 则 可 用 下 列 方式 调用 open 实现 : 


open (path, O_RDWR |O CREAT|O TRUNC, mode); 


3.5 AŽ close 


可 调用 close 函数 关闭 一 个 打开 文件 。 


#include <unistd.h> 


int close (int fd) 





返回 值 :车 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 
关闭 一 个 文件 时 还 会 释放 该 进程 加 在 该 文件 上 的 所 有 记录 锁 。14.3 节 将 讨论 这 一 点 。 
当 一 个 进程 终止 时 ， 内 核 自动 关闭 它 所 有 的 打开 文件 。 很 多 程序 都 利用 了 这 一 功能 而 不 显 式 
地 用 close 关闭 打开 文件 。 实 例 见 图 1-4 程序 。 


3.6 PAR lseek 


每 个 打开 文件 都 有 一 个 与 其 相关 联 的 “当前 文件 偏 移 量 ”(current file offset)。 它 通常 是 一 个 
非 负 整数 ， 用 以 度量 从 文件 开始 处 计算 的 字 节 数 〈 本 节 稍 后 将 对 “ 非 负 ” 这 一 修饰 词 的 某 些 例外 
进行 说 明 )。 通 常 ， 读 、 写 操作 都 从 当前 文件 偏 移 量 处 开始 ， 并 使 偏 移 量 增加 所 读 写 的 字 节 数 。 
按 系统 默认 的 情况 ， 当 打开 一 个 文件 时 ， 除 非 指定 O APPEND 选项 ， 否 则 该 偏 移 量 被 设置 为 0。 
可 以 调用 1seek 显 式 地 为 一 个 打开 文件 设置 偏 移 量 。 


#include <unistd.h> 
off t lseek(int fd, off t offset, int whence); 
返回 值 ， 车 成 功 ， 返 回 新 的 文件 偏 移 量 ， 若 出 错 ， 返 回 为 -1 


对 参数 offset 的 解释 与 参数 whence 的 值 有 关 。 

e di whence 是 SEEK_SET， 则 将 该 文件 的 偏 移 量 设置 为 距 文件 开始 处 offset 个 字 节 。 

e 若 whence 是 SEEK_ CUR， 则 将 该 文件 的 偏 移 量 设置 为 其 当前 值 加 offset, offset 可 为 正 或 负 。 
e 若 whence 是 SEEK_END， 则 将 该 文件 的 偏 移 量 设置 为 文件 长 度 加 offset, offset 可 正 

















可 负 。 
若 lseek 成 功 执行 ， 则 返回 新 的 文件 偏 移 量 ， 为 此 可 以 用 下 列 方式 确定 打开 文件 的 当前 偏 移 量 : 
off t currpos; 


currpos = lseek(fd, 0, SEEK CUR); 
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这 种 方法 也 可 用 来 确定 所 涉及 的 文件 是 否 可 以 设置 偏 移 量 。 如 果 文 件 描述 符 指 向 的 是 一 个 管 
道 、FIFO 或 网 络 套 接 字 ， 则 1seek 返回 一 1:， 并 将 errno 设置 为 ESPIPE。 
3 个 符号 常量 SEEK SET, SEEK CUR 和 SEEK END 是 在 System V 中 引入 的 。 在 System V 之 
AY, whence 被 指定 为 0( 绝对 偏 移 量 ), 1 ( 相对 于 当前 位 置 的 偏 移 量 ) 或 2 ( 相对 文件 尾 端的 偏 
移 量 )。 很 多 软件 仍然 把 这 些 数 字 直 接 写 在 代码 里 。 
在 lseek 中 的 字符 1 表示 长 整 型 。 在 引入 off t 数据 类 型 之 前 ,offset 参数 和 返回 值 是 长 整 
型 的 ,lseek 是 在 UNIX V7 中 引入 的 ,当时 C 语言 中 增加 了 长 整 型 (在 UNIXYV6 中 ,用 函数 seek 
fe tell 提供 类 似 功能 )。 
BE 
图 3-1 所 示 的 程序 用 于 测试 对 其 标准 输入 能 否 设 置 偏 移 量 。 








#include "apue.h" 
int 
main (void) 
{ 
if (lseek(STDIN FILENO, 0, SEEK CUR) == -1) 
printf ("cannot seek\n"); 
else 
printf ("seek OK\n"); 
exit (0); 


图 3-1 测试 标准 输入 能 和 否 被 设置 偏 移 量 
如 果 用 交互 方式 调用 此 程序 ， 则 可 得 


$ ./a.out < /etc/passwd 

Seek OK 

$ cat < /etc/passwd| ./a.out 
cannot seek 

$ ./a.out < /var/spool/cron/FIFO 
cannot seek 


通常 ， 文 件 的 当前 偏 移 量 应 当 是 一 个 非 负 整数 ， 但 是 ， 某 些 设备 也 可 能 允许 负 的 偏 移 量 。 但 
对 于 普通 文件 ， 其 偏 移 量 必 须 是 非 负 值 。 因 为 偏 移 量 可 能 是 负 值 ， 所 以 在 比较 lseek 的 返回 值 
时 应 当 谨 慎 ， 不 要 测试 它 是 否 小 于 0， 而 要 测试 它 是 否 等 于 一 1。 

在 Intel x86 处 理 器 上 运行 的 FreeBSD 的 设备 /dev/kmem 支持 负 的 偏 移 量 。 
因为 偏 移 量 (off t) 是 带 符号 数据 类 型 (OLEI 2-21 )， 所 以 文件 的 最 大 长 度 会 减少 一 半 。 例 
go, Hoff 七 是 32 位 整 型 ， 则 文件 最 大 长 度 是 231- 1 个 字 节 。 


lseek 仅 将 当前 的 文件 偏 移 量 记录 在 内 核 中 ， 它 并 不 引起 任何 IO 操作 。 然 后 ， 该 偏 移 量 用 
于 下 一 个 读 或 写 操作 。 

文件 偏 移 量 可 以 大 于 文件 的 当前 长 度 ， 在 这 种 情况 下 ， 对 该 文件 的 下 一 次 写 将 加 长 该 文件 ， 
并 在 文件 中 构成 一 个 空洞 ， 这 一 点 是 允许 的 。 位 于 文件 中 但 没有 写 过 的 字 节 都 被 读 为 0。 

文件 中 的 空洞 并 不 要 求 在 磁盘 上 占用 存储 区 。 有 具体 处 理 方式 与 文件 系统 的 实现 有 关 ， 当 定位 
到 超出 文件 尾 端 之 后 写 时 ， 对 于 新 写 的 数据 需要 分 配 磁盘 块 ， 但 是 对 于 原文 件 尾 端 和 新 开始 写 位 
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置 之 间 的 部 分 则 不 需要 分 配 磁盘 块 。 


实例 
图 3-2 所 示 的 程序 用 于 创建 一 个 具有 空洞 的 文件 。 


#include "apue.h" 
#include «fcntl.h» 





char bufl[] = "abcdefghij"; 
char buf2[] = "ABCDEFGHIJ"; 
int 


main (void) 
{ 
int fd; 


if ((fd = creat ("file.hole", FILE MODE)) < 0) 
err sys("creat error"); 


if (write(fd, bufl, 10) !- 10) 
err sys("bufl write error"); 
/* offset now - 10 */ 


if (lseek(fd, 16384, SEEK SET) -- -1) 
err sys("lseek error"); 
/* offset now = 16384 */ 


if (write(fd, buf2, 10) != 10) 
err sys("buf2 write error"); 
/* offset now - 16394 */ 


exit(0); 
) 

图 3-2 创建 一 个 具有 空洞 的 文件 
运行 该 程序 得 到 : 
$ ./a.out 
$ ls -1 file.hole 检查 其 大 小 
eXWw-r--£-- 1 saf 16394 Nov 25 01:01 file.hole 
$ od -c file.hole 观察 实际 内 容 


0000000 a b cde f£ g h i j \O NO NO NO NO NO 
0000020 \O NO NO NO NO NO NO NO NO NO NO NO NO NO NO NO 
* 

0040000 A B C D E F GH I J 

0040012 


函数 lseek 
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使 用 od() 命 令 观 察 该 文件 的 实际 内 容 。 命 令 行 中 的 -c 标志 表示 以 字符 方式 打印 文件 内 容 。 从 中 
可 以 看 到 , 文件 中 间 的 30 个 未 写 入 字 节 都 被 读 成 0。 每 一 行 开 始 的 一 个 7 位 数 是 以 八进制 形式 表 


示 的 字 节 偏 移 量 。 


为 了 证 明 在 该 文件 中 确实 有 一 个 空洞 ， 将 刚 创 建 的 文件 与 同样 长 度 但 无 空洞 的 文件 进行 


比较 : 
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$ ls -ls file.hole file.nohole 比较 长 度 


B -rw-r--r-- 1 sar 
20 —-rw-r--r-- 1 sar 


16394 Nov 25 01:01 file.hole 
16394 Nov 25 01:03 file.nohole 


虽然 两 个 文件 的 长 度 相同 ,但 无 空洞 的 文件 占用 了 20 个 磁盘 块 , 而 具有 空洞 的 文件 只 占用 8 


个 磁盘 块 。 


在 此 实例 中 调用 了 将 在 3.8 节 中 说 明 的 write 函数 。4.12 节 将 对 具有 空洞 的 文件 进行 更 多 


说 明 。 


因为 lseek 使 用 的 偏 移 量 是 用 otf c 类 型 表示 的 ， 所 以 允许 具体 实现 根据 各 自 特 定 的 平台 
自行 选择 大 小 合适 的 数据 类 型 。 现 今 大 多 数 平台 提供 两 组 接口 以 处 理 文件 偏 移 量 。 一 组 使 用 32 
位 文件 偏 移 量 ， 男 一 组 则 使 用 64 位 文件 偏 移 量 。 
Single UNIX Specification 向 应 用 程序 提供 了 一 种 方法 ， 使 其 通过 sysconf 函数 确定 支持 何 
种 环境 ( 见 2.5.4 节 )。 图 3-3 总 结 了 定义 的 sysconf 常量 。 


_POSTX_V7_ILP32_OFF32 
_POSIX_V7_ILP32_OFFBIG 


_POSIX_V7_LP64_OFF64 


_POSIX_V7_LP64_OFFBIG 





a 


int. long. EA of f_t 类 型 是 32 位 _SC_V7_ILP32_OFF32 


int、1long、 指 针 类 型 是 32 fiz, off t KAY | sC v7 ILP32 OFFBIG 
至 少 是 64 位 

int 类 型 是 32 位 ，long、 指 针 和 off 上 类 | sc v7 LP64 OFF64 
型 是 64 位 

int 类 型 是 32 位 ，long、 指针 和 off t 类 | sc v7 LP64 OFFBIG 
型 至 少 是 64 位 


3-3 sysconf 的 数据 大 小 选项 和 name 参数 
c99 编译 器 要 求 使 用 getconf(1) 命 令 将 所 期 望 的 数据 大 小 模型 映射 为 编译 和 链接 程序 所 需 
的 标志 。 根 据 每 个 平台 支持 环境 的 不 同 ， 可 能 需要 不 同 的 标志 和 库 。 
遗憾 的 是 ， 在 这 方面 ， 实 现 还 未 跟 上 标准 的 步伐 。 如 果 你 的 系统 没有 匹配 标准 的 最 新 版 本 ， 那 
么 系统 还 可 能 支持 Single UNIX Specification 前 一 版 本 中 的 选项 名 : POSIX V6 ILP32 OFF32, 
_POSIX_V6_ILP32_OFFBIG, _POSIX_V6_LP64_OFF64 4*_POSIX_V6 LP64 OFFBIG, 
为 了 避 开 这 一 点 ， 应 用 程序 可 以 将 符号 常量 FILE OFFSET BITS 设置 为 64， 以 支持 64 位 
偏 移 量 。 这 样 就 将 off t 定义 更 改 为 64 位 带 符号 整 型 。 将 FILE OFFSET_BITS 符号 常量 设置 
为 32 以 支持 32 位 偏 移 量 。 但 是 ,应 当 注 意 的 是 ， 虽 然 本 书 讨论 的 4 种 平台 都 支持 32 位 和 64 位 
文件 偏 移 量 ， 但 是 通过 设置 FILE OFFSET BITS 符号 常量 的 值 这 种 方法 并 不 能 保证 应 用 程序 是 
可 移植 的 ， 也 有 可 能 达 不 到 预期 的 效果 。 
图 3-4 总 结 了 在 本 书 涉 及 的 4 种 平台 上 ， 当 应 用 程序 没有 定义 FILE OFFSET BITS Hj, off t 
数据 类 型 的 字 节 数 以 及 FILE OFFSET BITS 被 定义 成 32 3,64 时 ，off 七 数据 类 型 的 字 节 数 。 


操作 系统 





FILE OFFSET BITS fff 


未 定义 32 64 


CPU 架构 














FreeBSD 8.0 
Linux 3.2.0 







Solaris 10 


Mac OS X 10.6.8 


x86 32 位 

x86 64 位 

x86 64 位 
SPARC 64 位 


图 3-4 不 同 平台 上 of ft 的 字 节 数 
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注意 ;尽管 可 以 实现 64 位 文件 偏 移 量 ， 但 是 能 否 创建 一 个 大 于 2 GB (277-1 字 节 ) 的 文件 
则 依赖 于 底层 文件 系统 的 类 型 。 


3.7 


函数 read 


调用 read 函数 从 打开 文件 中 读数 据 。 


#include <unistd.h> 





ssize 七 read(int fd, void *buf, size_t nbytes); 


返回 值 : 读 到 的 字 节 数 ， 若 已 到 文件 尾 ， 返 回 0， 若 出 错 ， 返 回 一 1 





如 read 成 功 ， 则 返回 读 到 的 字 节 数 。 如 已 到 达 文件 的 尾 端 ， 则 返回 0。 
有 多 种 情况 可 使 实际 读 到 的 字 节 数 少 于 要 求 读 的 字 节 数 : 


读 普 通 文件 时 ， 在 读 到 要 求 字 节 数 之 前 已 到 达 了 文件 尾 端 。 例 如 ， 若 在 到 达 文 件 尾 端 之 前 
有 30 个 字 节 ， 而 要 求 读 100 个 字 节 ， 则 read 返回 30。 下 一 次 再 调用 read 时 ， 它 将 返回 
0 文件 尾 端 )。 

当 从 终端 设备 读 时 ， 通 常 一 次 最 多 读 一 行 〈 第 18 章 将 介绍 如 何 改变 这 一 点 )。 

当 从 网 络 读 时 ， 网 络 中 的 缓冲 机 制 可 能 造成 返回 值 小 于 所 要 求 读 的 字 节 数 。 

当 从 管道 或 FIFO 读 时 ， 如 若 管道 包含 的 字 节 少 于 所 需 的 数量 ， 那 么 read 将 只 返回 实际 
可 用 的 字 节 数 。 

当 从 某 些 面向 记录 的 设备 (如 磁带 ) 读 时 ， 一 次 最 多 返回 一 个 记录 。 

当 一 信号 造成 中 断 ， 而 已 经 读 了 部 分 数据 量 时 。 我 们 将 在 10.5 节 进 一 步 讨 论 此 种 情况 。 


读 操 作 从 文件 的 当前 偏 移 量 处 开始 ， 在 成 功 返 回 之 前 ， 该 偏 移 量 将 增加 实际 读 到 的 字 节 数 。 
POSIX.1 从 几 个 方面 对 read 函数 的 原型 做 了 更 改 。 经 典 的 原型 定义 是 : 


int read(int fd, char *buf, unsigned nbytes) ; 


3.8 


首先 ， 为 了 与 ISO C 一 致 ， 第 2 个 参数 由 char * 改 为 void *. TEISOC 中 ,类 型 void * 
用 于 表示 通用 指针 。 

其 次 ， 返回 值 必须 是 一 个 带 符号 整 型 (ssize t)， 以 保证 能 够 返回 正 整 数字 节 数 、0 CE 
示 文 件 尾 端 ) 或 -1 (出 错 )。 

最 后 ， 第 3 个 参数 在 历史 上 是 一 个 无 符号 整 型 ， 这 允许 一 个 16 位 的 实现 一 次 读 或 写 的 数 
据 可 以 多 达 65 534 个 字 节 。 在 1990 POSIX.1 标准 中 ， 引 入 了 新 的 基本 系统 数据 类 型 
ssize tt 以 提供 带 符号 的 返回 值 , 不 带 符号 的 size t 则 用 于 第 3 个 参数 ( 见 2.5.2 节 中 
的 SSIZE_MAX 常量 )。 


函数 write 


调用 write 函数 向 打开 文件 写 数据 。 





#include <unistd.h> 


ssize t write(int fd, const void *buf, size t nbytes) 


返回 值 : 若 成 功 ， 返 回 已 写 的 字 节 数 ， 若 出 错 ， 返 回 -1 
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其 返回 值 通常 与 参数 nbytes 的 值 相同 ,否则 表示 出 错 。 write 出 错 的 一 个 常见 原因 是 磁盘 已 
写 满 ， 或 者 超过 了 一 个 给 定 进程 的 文件 长 度 限制 ( 见 7.11 节 及 习题 10.11 )。 

对 于 普通 文件 , 写 操作 从 文件 的 当前 偏 移 量 处 开始 。 如 果 在 打开 该 文件 时 , 指定 了 oO_APPEND 
选项 ， 则 在 每 次 写 操作 之 前 ， 将 文件 偏 移 量 设置 在 文件 的 当前 结尾 处 。 在 一 次 成 功 写 之 后 ， 该 文 
件 偏 移 量 增加 实际 写 的 字 节 数 。 


3.9 1/0 的 效率 
图 3-5 程序 只 使 用 read 和 write 函数 复制 一 个 文件 。 








#include "apue.h" 
#define BUFFSIZE 4096 


int 
main (void) 
{ 
int nj 
char buf[BUFFSIZE]; 


while ((n = read(STDIN FILENO, buf, BUFFSIZE)) > 0) 
if (write(STDOUT FILENO, buf, n) !- n) 
err sys("write error"); 


if (n « 0) 
err sys("read error"); 


exit(0); 


图 3-5 将 标准 输入 复制 到 标准 输出 
关于 该 程序 应 注意 以 下 几 点 。 
。 它 从 标准 输入 读 ， 写 至 标准 输出 ， 这 就 假定 在 执行 本 程序 之 前 ， 这 些 标准 输入 、 输 出 已 
由 shell 安排 好 。 确 实 ， 所 有 常用 的 UNIX 系统 shell 都 提供 一 种 方法 ， 它 在 标准 输入 上 打 
开 一 个 文件 用 于 读 ， 在 标准 输出 上 创建 (或 重 写 ) 一 个 文件 。 这 使 得 程序 不 必 打 开 输 入 
和 输出 文件 ， 并 允许 用 户 利用 shell 的 UO 重 定向 功能 。 
。 考虑 到 进程 终止 时 ，UNIX 系统 内 核 会 关闭 进程 的 所 有 打开 的 文件 描述 符 ， 所 以 此 程序 并 
不 关闭 输入 和 输出 文件 。 
。 对 UNIX 系统 内 核 而 言 ， 文 本 文件 和 二 进 制 代码 文件 并 无 区 别 ， 所 以 本 程序 对 这 两 种 文 
件 都 有 效 。 
我 们 还 没有 回答 的 一 个 问题 是 如 何 选 取 BUFFSIZE fü. 在 回答 此 问题 之 前 ， 让 我 们 先 用 各 种 
不 同 的 BUFFSIZE 值 来 运行 此 程序 。 图 3-6 显示 了 用 20 种 不 同 的 缓冲 区 长 度 ， 读 516 581 760 F 
节 的 文件 所 得 到 的 结果 。 
用 图 3-5 的 程序 读 文 件 ， 其 标准 输出 被 重新 定向 到 /dev/null 上 。 此 测试 所 用 的 文件 系统 
是 Linux ext4 文件 系统 , 其 磁盘 块 长 度 为 4096 字 节 (磁盘 块 长 度 由 st_blksize 表示 , 在 4.12 
节 中 说 明 其 值 为 4096)。 这 也 证 明了 图 3-6 中 系统 CPU 时 间 的 儿 个 最 小 值 差 不 多 出 现在 
BUFFSIZE 为 4096 及 以 后 的 位 置 ， 继 续 增 加 缓冲 区 长 度 对 此 时 间 几 乎 没有 影响 。 





BUFFSIZE 


131 072 
262 144 
524 288 


用 户 CPU (s) 
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系统 CPU (s) 


时 钟 时 间 Cs) 循环 次 数 








516 581 760 
258 290 880 
129 145 440 
64 572 720 
32 286 360 
16 143 180 
8 071 590 

4 035 795 
2017 898 

1 008 949 
504 475 
252 238 
126 119 

63 060 

31 530 

15 765 

7 883 

3942 

1971 

986 





图 3-6 Linux 上 用 不 同 缓冲 长 度 进行 读 操作 的 时 间 结 果 
大 多 数 文件 系统 为 改善 性 能 都 采用 某 种 预 读 (read ahead) 技术 。 当 检测 到 正 进行 顺序 读 取 时 ， 
系统 就 试图 读 入 比 应 用 所 要 求 的 更 多 数据 ， 并 假想 应 用 很 快 就 会 读 这 些 数据 。 预 读 的 效果 可 以 从 
图 3-6 中 看 出 ， 缓 冲 区 长 度 小 至 32 字 节 时 的 时 钟 时 间 与 拥有 较 大 缓冲 区 长 度 时 的 时 钟 时 间 儿 乎 一 样 。 [73 | 
我 们 以 后 还 将 回 到 这 一 实例 上 。3.14 节 将 用 此 说 明 同 步 写 的 效果 ，5.8 节 将 比较 不 带 缓冲 的 
IO 时 间 与 标准 IO 库 所 用 的 时 间 。 


应 当 了 解 ， 在 什么 时 间 对 实施 文件 读 、 写 操作 的 程序 进行 性 能 度量 。 操 作 系 统 试 图 用 高 速 缓存 技术 
将 相关 文件 放置 在 主 存 中 ， 所 以 如 若 重 复 度量 程序 性 能 ， 那 么 后 续 运行 该 程序 所 得 到 的 计时 很 可 能 好 于 
第 一 次 。 其 原因 是 ， 第 一 次 运行 使 得 文件 进入 系统 高 速 缓存 ， 后 续 各 次 运行 一 般 从 系统 高 速 缓存 访问 文 
fF, 无 需 读 、 写 磁盘 。(incore 这 个 词 的 意思 是 在 主 存 中 , 早期 计算 机 的 主 存 是 用 铁 氧 体 磁 心 ( ferrite core ) 
做 的 ， 这 也 是 “core dump” 这 个 词 的 由 来 : 程序 的 主 存 镜像 存放 在 磁盘 的 一 个 文件 中 以 便 测 试 诊断 )。 

在 图 3-6 所 示 的 测试 数据 中 ， 不 同 缓冲 区 长 度 的 各 次 运行 使 用 不 同 的 文件 副本 ， 所 以 后 一 次 
运行 不 会 在 前 一 次 运行 的 高 速 缓存 中 找到 它 需 要 的 数据 。 这 些 文件 都 足够 大 ， 不 可 能 全 部 保留 在 
高 速 缓存 中 (测试 系统 配置 了 6 GB RAM )。 


3.10 ”文件 共享 


UNIX 系统 支持 在 不 同 进程 间 共享 打开 文件 。 在 介绍 dup 函数 之 前 ， 先 要 说 明 这 种 共享 。 为 
此 先 介绍 内 核 用 于 所 有 VO 的 数据 结构 。 
下 面 的 说 明 是 概念 性 的 , 与 特定 实现 可 能 匹配 , 也 可 能 不 匹配 ,请 参阅 Bach[1986] 对 System V 
中 相关 数据 结构 的 讨论 。McKusick 等 [1996] 说 明 4.4BSD 中 的 相关 数据 结构 。McKusick 和 
Neville-Nell[2005] 对 FreeBSD 5.2 进行 了 介绍 。 对 Solaris 的 类 似 讨论 请 参见 McDougall 和 
Marno[2007]。Linux 2.6 内 核 体系 结构 介绍 请 参见 Bovet 和 Cesati[2006].. 
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内 核 使 用 3 种 数据 结构 表示 打开 文件 ， 它 们 之 间 的 关系 决定 了 在 文件 共享 方面 一 个 进程 对 另 
一 个 进程 可 能 产生 的 影响 。 

(1) 每 个 进程 在 进程 表 中 都 有 一 个 记录 项 ， 记 录 项 中 包含 一 张 打开 文件 描述 符 表 ， 可 将 其 视 
为 一 个 矢量 ， 每 个 描述 符 占 用 一 项 。 与 每 个 文件 描述 符 相 关联 的 是 : 

a. 文件 描述 符 标志 (close on exec， 参 见 图 3-7 和 3.14 节 ); 

b. 指向 一 个 文件 表 项 的 指针 。 

(2) 内 核 为 所 有 打开 文件 维持 一 张 文 件 表 。 每 个 文件 表 项 包含 : 

a. 文件 状态 标志 《〈 读 、 写 、 添 写 、 同 步 和 非 阻塞 等 ， 关 于 这 些 标 志 的 更 多 信息 参见 3.14 节 ); 

b. 当前 文件 偏 移 量 ; 

c， 指 向 该 文件 v 节点 表 项 的 指针 。 

(3) 每 个 打开 文件 (或 设备 ) 都 有 一 个 v 节点 〈v-node) 结构 。v 节点 包含 了 文件 类 型 和 对 

此 文件 进行 各 种 操作 函数 的 指针 。 对 于 大 多 数 文件 ，v 节点 还 包含 了 该 文件 的 i 节 点 〈i-node， 索 

引 节 点 )。 这 些 信息 是 在 打开 文件 时 从 磁盘 上 读 入 内 存 的 ， 所 以 ， 文 件 的 所 有 相关 信息 都 是 随时 
可 用 的 。 例 如 ，i 节点 包含 了 文件 的 所 有 者 、 文 件 长 度 、 指 向 文件 实际 数据 块 在 磁盘 上 所 在 位 置 
的 指针 等 (4.14 节 较 详细 地 说 明了 典型 UNIX 系统 文件 系统 ， 并 将 更 多 地 介绍 i 节点 )。 


Linux 没有 使 用 V 节点 ， 而 是 使 用 了 通用 i 节点 结构 。 虽 然 两 种 实现 有 所 不 同 ， 但 在 概念 上 ， 
V 节点 与 i 节点 是 一 样 的 。 两 者 都 指向 文件 系统 特有 的 i 节点 结构 。 


我 们 忽略 了 那些 不 影响 讨论 的 实现 细节 。 例 如 ， 打 开 文 件 描述 符 表 可 存放 在 用 户 空间 (作为 一 
个 独立 的 对 应 于 每 个 进程 的 结构 ， 可 以 换 出 )， 而 非 进程 表 中 。 这 些 表 也 可 以 用 多 种 方式 实现 ， 不 
必 一 定 是 数组 , 例如 ,可 将 它们 实现 为 结构 的 链表 。 如 果 不 考虑 实现 细节 的 话 , 通用 概念 是 相同 的 。 

图 3-7 显示 了 一 个 进程 对 应 的 3 张 表 之 间 的 关系 。 该 进程 有 两 个 不 同 的 打开 文件 ， 一 个 文件 
从 标准 输入 打开 (文件 描述 符 0)， 另 一 个 从 标准 输出 打开 (文件 描述 符 为 D. 

进程 表 项 文件 表 项 v 节 点 表 项 
文件 状态 标志 v 节点 信息 
当前 文件 偏 移 量 dug t Sy 
| vidt 一 © IT 
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fd 
标志 “文件 指针 
























当前 文件 偏 移 量 








v 节点 表 项 

















图 3-7 ”打开 文件 的 内 核 数 据 结构 
从 UNIX 系统 的 早期 版 本 [Thompson 1978] 以 来 ,这 3 张 表 之 间 的 关系 一 直 保 持 至 今 。 这 种 关 
系 对 于 在 不 同 进程 之 间 共 享 文件 的 方式 非常 重要 。 在 以 后 的 章节 中 涉及 其 他 文件 共享 方式 时 还 会 
回 到 这 张 图 上 来 。 
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创建 v 节点 结构 的 目的 是 对 在 一 个 计算 机 系统 上 的 多 文件 系统 类 型 提供 支持 。 这 一 工作 是 
Peter Weinberger ( 贝尔 实验 室 ) 和 Bill Joy (Sun 公司 ) 分 别 独立 完成 的 。Sun 把 这 种 文件 系统 称 
为 虚拟 文件 系统 ( Virtual File System ), 把 与 文件 系统 无 关 的 i 节点 部 分 称 为 v 节点 [Kleiman 1986]。 

， 当 各 个 制造 商 的 实现 增加 了 对 Sun 的 网 络 文件 系统 (NFS ) 的 支持 时 ， 它 们 都 广泛 采用 了 v 节点 
结构 。 在 BSD 系列 中 首先 提供 v 节点 的 是 增加 了 NFS 的 4.3BSD Reno, 

在 SVR4 F, v 节点 替代 了 SVR3 中 与 文件 系统 无 关 的 i 节点 结构 。Solaris 是 从 SVR4 发 展 而 
来 的 ， 因 此 它 也 使 用 v 节点 。 

Linux 没有 将 相关 数据 结构 分 为 1 节点 和 vV 节点 ， 而 是 采用 了 一 个 与 文件 系统 相关 的 i 节点 和 
一 个 与 文件 系统 无 关 的 1 节点 。 


如 果 两 个 独立 进程 各 自打 开 了 同一 文件 ， 则 有 图 3-8 中 所 示 的 关系 。 
进程 表 项 
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图 3-8 ”两 个 独立 进程 各 自打 开 同 一 个 文件 


我 们 假定 第 一 个 进程 在 文件 描述 符 3 上 打开 该 文件 ， 而 另 一 个 进程 在 文件 描述 符 4 上 打开 该 文件 。 
打开 该 文件 的 每 个 进程 都 获得 各 自 的 一 个 文件 表 项 ,但 对 一 个 给 定 的 文件 只 有 一 个 v 节点 表 项 。 之 所 
以 每 个 进程 都 获得 自己 的 文件 表 项 ， 是 因为 这 可 以 使 每 个 进程 都 有 它 自己 的 对 该 文件 的 当前 偏 移 量 。 

给 出 了 这 些 数据 结构 后 ， 现 在 对 前 面 所 述 的 操作 进一步 说 明 。 | 76 | 

。 在 完成 每 个 write 后 ， 在 文件 表 项 中 的 当前 文件 偏 移 量 即 增加 所 写 入 的 字 节 数 。 如 果 这 
导致 当前 文件 偏 移 量 超出 了 当前 文件 长 度 , 则 将 i 节点 表 项 中 的 当前 文件 长 度 设置 为 当前 
文件 偏 移 量 〈 也 就 是 该 文件 加 长 了 )。 

。 如 果 用 O APPEND 标志 打开 一 个 文件 ， 则 相应 标志 也 被 设置 到 文件 表 项 的 文件 状态 标志 
每 次 对 这 种 具有 追加 写 标 志 的 文件 执行 写 操作 时 ， 文 件 表 项 中 的 当前 文件 偏 移 量 首先 会 被 
设置 为 i 节 点 表 项 中 的 文件 长 度 。 这 就 使 得 每 次 写 入 的 数据 都 追加 到 文件 的 当前 尾 端 处 。 

。 若 一 个 文件 用 1seek 定位 到 文件 当前 的 尾 端 ， 则 文件 表 项 中 的 当前 文件 偏 移 量 被 设置 为 i 节 
点 表 项 中 的 当前 文件 长 度 (注意 ， 这 与 用 O APPEND 标志 打开 文件 是 不 同 的 ， 详 见 3.11 节 )。 

。 lseek 函数 只 修改 文件 表 项 中 的 当前 文件 偏 移 量 ， 不 进行 任何 VO 操作 。 
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可 能 有 多 个 文件 描述 符 项 指向 同一 文件 表 项 。 在 3.12 节 中 讨论 dup 函数 时 ， 我 们 就 能 看 到 
这 一 点 。 在 fork 后 也 发 生 同 样 的 情况 ， 此 时 父 进程 、 子 进程 各 自 的 每 一 个 打开 文件 描述 符 共享 
同一 个 文件 表 项 〈 见 8.3 节 )。 

注意 ， 文 件 描述 符 标志 和 文件 状态 标志 在 作用 范围 方面 的 区 别 ， 前 者 只 用 于 一 个 进程 的 一 个 
描述 符 , 而 后 者 则 应 用 于 指向 该 给 定 文件 表 项 的 任何 进程 中 的 所 有 描述 符 。 在 3.14 节 说 明 fcnt1 
函数 时 ， 我 们 将 会 了 解 如 何 获取 和 修改 文件 描述 符 标志 和 文件 状态 标志 。 

本 节 前 面 所 述 的 一 切 对 于 多 个 进程 读 取 同 一 文件 都 能 正确 工作 。 每 个 进程 都 有 它 自 己 的 文件 
表 项 ， 其 中 也 有 它 自 己 的 当前 文件 偏 移 量 。 但 是 ， 当 多 个 进程 写 同一 文件 时 ， 则 可 能 产生 预想 不 
到 的 结果 。 为 了 说 明 如 何 避 免 这 种 情况 ， 需 要 理解 原子 操作 的 概念 。 


3.11 原子 操作 


1. 追加 到 一 个 文件 
考虑 一 个 进程 ， 它 要 将 数据 追加 到 一 个 文件 尾 端 。 早 期 的 UNIX 系统 版 本 并 不 支持 open 的 
O_APPEND 选项 ， 所 以 程序 被 编写 成 下 列 形式 : 


if (lseek(fd,OL, 2) < 0) /*position to EOF*/ 
err_sys("lseek error"); 
if (write(fd, buf, 100) != 100) /*and write*/ 


err sys("write error"); 

对 单个 进程 而 言 ， 这 段 程序 能 正常 工作 ， 但 若 有 多 个 进程 同时 使 用 这 种 方法 将 数据 追加 写 到 
同一 文件 ， 则 会 产生 间 题 例如， 车 此 程序 由 多 个 进程 同时 执行 ， 各 自 将 消息 追加 到 一 个 日 志文 
件 中 ， 就 会 产生 这 种 情况 )。 

假定 有 两 个 独立 的 进程 A 和 B 都 对 同一 文件 进行 追加 写 操作 。 每 个 进程 都 已 打开 了 该 文件 ， 
但 未 使 用 O_APPEND 标志 。 此 时 ， 各 数据 结构 之 间 的 关系 如 图 3-8 中 所 示 。 每 个 进程 都 有 它 自 己 
的 文件 表 项 ， 但 是 共享 一 个 v 节点 表 项 。 假 定 进程 A 调用 了 lseek， 它 将 进程 A 的 该 文件 当前 
偏 移 量 设置 为 1500 字 节 (当前 文件 尾 端 处 )。 然 后 内 核 切换 进程 ,进程 B 运行 .进程 B 执行 lseek, 
也 将 其 对 该 文件 的 当前 偏 移 量 设置 为 1500 字 节 (当前 文件 尾 端 处 )。 然 后 B 调用 write, 它 将 B 
的 该 文件 当前 文件 偏 移 量 增加 至 1600。 因 为 该 文件 的 长 度 已 经 增加 了 , 所 以 内 核 将 v 节点 中 的 当 
前 文件 长 度 更 新 为 1600。 然 后 ,内 核 又 进行 进程 切换 ， 使 进程 A 恢复 运行 。 当 A 调用 write 时 ， 
就 从 其 当前 文件 偏 移 量 (1500) 处 开始 将 数据 写 入 到 文件 。 这 样 也 就 覆盖 了 进程 B 刚才 写 入 到 该 
文件 中 的 数据 。 

问题 出 在 逻辑 操作 “ 先 定位 到 文件 尾 端 ， 然 后 写 ”， 它 使 用 了 两 个 分 开 的 函数 调用 。 解 决 问题 
的 方法 是 使 这 两 个 操作 对 于 其 他 进程 而 言 成 为 一 个 原子 操作 。 任 何 要 求 多 于 一 个 函数 调用 的 操作 都 
不 是 原子 操作 ， 因 为 在 两 个 函数 调用 之 间 ， 内 核 有 可 能 会 临时 挂 起 进程 (正如 我 们 前 面 所 假定 的 )。 

UNIX 系统 为 这 样 的 操作 提供 了 一 种 原子 操作 方法 ， 即 在 打开 文件 时 设置 O APPEND 标志 。 
正如 前 一 节 中 所 述 ， 这 样 做 使 得 内 核 在 每 次 写 操作 之 前 ， 都 将 进程 的 当前 偏 移 量 设置 到 该 文件 的 
尾 端 处 ， 于 是 在 每 次 写 之 前 就 不 再 需要 调用 1seek. 

2. 函数 pread 和 pwrite 

Single UNIX Specification 包括 了 XSI 扩展 ， 该 扩展 允许 原子 性 地 定位 并 执行 JO。pread 和 
pwrite 就 是 这 种 扩展 。 


3.12 函数 dup 和 dup2 63 








#include <unistd.h> 
ssize_t pread(int fd, void *buf, size t nbytes, off t offset); 


返回 值 : 读 到 的 字 节 数 ， 若 已 到 文件 尾 ， 返 回 0; 若 出 错 ， 返 回 -1 


ssize_t pwrite(int fd, const void *buf, size t nbytes, off t offset); 


返回 值 : ERY, BASS, did e- 





调用 pread 相当 于 调用 1seek 后 调用 read, 但 是 pread 又 与 这 种 顺序 调用 有 下 列 重 要 区 别 。 
e 调用 pread 时 ， 无 法 中 断 其 定位 和 读 操 作 。 
。 不 更 新 当前 文件 偏 移 量 。 
调用 pwrite 相当 于 调用 lseek 后 调用 write， 但 也 与 它们 有 类 似 的 区 别 。 
3. 创建 一 个 文件 
对 open 函数 的 O_CRERAT 和 o. EXCL 选项 进行 说 明 时 , 我 们 已 见 到 另 一 个 有 关 原 子 操作 的 
例子 。 当 同时 指定 这 两 个 选项 ， 而 该 文件 又 已 经 存在 时 ，open 将 失败 。 我 们 曾 提 及 检查 文件 
是 否 存在 和 创建 文件 这 两 个 操作 是 作为 一 个 原子 操作 执行 的 。 如 果 没 有 这 样 一 个 原子 操作 ， 那 
么 可 能 会 编写 下 列 程序 段 : 
if ((fd = open(pathname, O WRONLY)) «O)( 
if (errno == ENOENT) { 
if ((fd = creat(path, mode)) < 0) 
err sys("creat error"); 
) else{ 
err sys("open error"); 


) 
} 


如 果 在 open 和 creat 之 间 ， 另 一 个 进程 创建 了 该 文件 ， 就 会 出 现 问题 。 若 在 这 两 个 函数 调用 
之 间 ,， 另 一 个 进程 创建 了 该 文件 , 并 且 写 入 了 一 些 数据 , 然后 , 原先 进程 执行 这 段 程序 中 的 creat, 
这 时 ， 刚 由 另 一 进程 写 入 的 数据 就 会 被 擦 去 。 如 车 将 这 两 者 合并 在 一 个 原子 操作 中 ， 这 种 问题 
也 就 不 会 出 现 。 

- 般 而 言 ， 原 子 操作 Catomic operation) 指 的 是 由 多 步 组 成 的 一 个 操作 。 如 果 该 操作 原子 地 
执行 ， 则 要 么 执行 完 所 有 步骤 ， 要 么 一 步 也 不 执行 ， 不 可 能 只 执行 所 有 步骤 的 一 个 子 集 。 在 4.15 
节 描 述 link 函数 以 及 在 14.3 节 中 说 明 记 录 锁 时 ， 还 将 讨论 原子 操作 。 


3.12 AŽ dup 和 dup2 


下 面 两 个 函数 都 可 用 来 复制 一 个 现 有 的 文件 描述 符 。 


#include <unistd.h> 














int dup(int fd); 
int dup2(int fd, int fd2); 
两 函数 的 返回 值 : 若 成 功 ， 返 回 新 的 文件 描述 符 ; 若 出 错 ， 返 回 -1 
由 dup 返回 的 新 文件 描述 符 一 定 是 当前 可 用 文件 描述 符 中 的 最 小 数值 。 对 于 dup2， 可 以 
用 122 参数 指定 新 描述 符 的 值 。 如 果 .应 2 已 经 打开 ， 则 先 将 其 关闭 。 如 若 应 等 于 /2， 则 dup2 
返回 f42， 而 不 关闭 它 。 否 则 ，f42 的 FD CLOEXEC 文件 描述 符 标 志 就 被 清除 ， 这 样 fd2 在 进程 








64 第 3 章 文件 IO 





调用 exec 时 是 打开 状态 。 
这 些 函 数 返 回 的 新 文件 描述 符 与 参数 应 共享 同一 个 文件 表 项 ， 如 图 3-9 所 示 。 
进程 表 项 


fd 
标志 文件 指针 
fd 0: 
fd 1: 
fd 2: 
fd 3: 


图 3-9 ”qdup(1) 后 的 内 核 数据 结构 

在 此 图 中 ， 我 们 假定 进程 启动 时 执行 了 : 

newfd = dup(1); 
当 此 函数 开始 执行 时 ， 假 定 下 一 个 可 用 的 描述 符 是 3〈 这 是 非常 可 能 的 ， 因 为 0，1 和 2 都 由 shell 
打开 )。 因 为 两 个 描述 符 指向 同一 文件 表 项 ， 所 以 它们 共享 同一 文件 状态 标志 《〈 读 、 写 、 追 加 等 ) 
以 及 同一 当前 文件 偏 移 量 。 

每 个 文件 描述 符 都 有 它 自己 的 一 套 文件 描述 符 标志 。 正 如 我 们 将 在 下 一 节 中 说 明 的 那样 ， 新 
描述 符 的 执行 时 关闭 (close-on-exec) 标志 总 是 由 dup 函数 清除 。 

复制 一 个 描述 符 的 另 一 种 方法 是 使 用 font] 函数 ，3.14 节 将 对 该 函数 进行 说 明 。 实 际 上 ， 
调用 

dup (fd); 
等 效 于 

fentl (fd, F_DUPFD, 0); 
而 调用 

dup2 (fd, fd2); 
等 效 于 


close (fd2); 
fcntl(fd, F DUPFD, fd2); 


在 后 一 种 情况 下 ，dup2 并 不 完全 等 同 于 close 加 上 fcnt1。 它 们 之 间 的 区 别 具 体 如 下 。 
(D dup2 是 一 个 原子 操作 ， 而 close 和 fcntl 包括 两 个 函数 调用 。 有 可 能 在 close 和 
fcntl 之 间 调 用 了 信号 捕获 函数 ， 它 可 能 修改 文件 描述 符 (第 10 章 将 说 明 信 和 号 )。 如 果 不 同 的 线 
程 改变 了 文件 描述 符 的 话 也 会 出 现 相同 的 问题 (第 11 章 将 说 明 线程 )。 
(2) dup2 和 fcntl 有 一 些 不 同 的 errno。 
dup2 系统 调用 起 源 于 V7， 然后 传播 至 所 有 BSD 版 本 。 而 复制 文件 描述 符 的 fcnt1 FAM 
首先 由 系统 II[ 使 用 ， 然 后 由 System V 继续 采用 。SVR3.2 选用 了 dup2 函数 ，4.2BSD Wit AT 
fcntl HHA F_DUPFD 功能 。POSIX.1 要 求 兼 有 dup2 及 fcntl th F DUPFD 两 种 功能 。 
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3.13 RM sync. fsync 和 fdatasync 


传统 的 UNIX 系统 实现 在 内 核 中 设 有 缓冲 区 高 速 缓存 或 页 高 速 缓存 ， 大 多 数 磁盘 VO 都 通过 缓冲 
区 进行 。 当 我 们 向 文件 写 入 数据 时 ， 内 核 通常 先 将 数据 复制 到 缓冲 区 中 ， 然 后 排 入 队列 ， 晚 些 时 候 再 
写 入 磁盘 。 这 种 方式 被 称 为 延迟 写 (delayed write) (Bach[1986] 的 第 3 章 详细 讨论 了 缓冲 区 高 速 缓存 )。 

通常 , 当 内 核 需 要 重用 缓冲 区 来 存放 其 他 磁盘 块 数据 时 , 它 会 把 所 有 延迟 写 数据 块 写 入 磁盘 。 
为 了 保证 磁盘 上 实际 文件 系统 与 缓冲 区 中 内 容 的 一 致 性 ，UNIX 系统 提供 了 sync、fsync 和 
fdatasync 三 个 函数 。 





#include<unistd.h> 
int fsync(int fd); 


int fdatasync(int fd); 


返回 值 : 若 成 功 ， 返 回 0; 车 出 错 ， 返 回 -1 





void sync(void); ” 
sync 只 是 将 所 有 修改 过 的 块 缓冲 区 排 入 写 队 列 ， 然 后 就 返回 ， 它 并 不 等 待 实 际 写 磁盘 操作 结束 。 
通常 ， 称 为 update 的 系统 守护 进程 周期 性 地 调用 (一 般 每 阳 30 秒 ) sync 函数 。 这 就 保证 
了 定期 冲洗 (flush)〉 内核 的 块 缓冲 区 。 命 令 sync(1) 也 调用 sync 函数 。 
fsync 函数 只 对 由 文件 描述 符 入 指定 的 一 个 文件 起 作用 ， 并 且 等 待 写 磁盘 操作 结束 才 返 回 。 
fsync 可 用 于 数据 库 这 样 的 应 用 程序 ， 这 种 应 用 程序 需要 确保 修改 过 的 块 立即 写 到 磁盘 上 。 
fdatasync 函数 类 似 于 fsync， 但 它 只 影响 文件 的 数据 部 分 。 而 除数 据 外 ，fsync 还 会 同 
步 更 新 文件 的 属性 。 
本 书 说 明 的 所 有 4 种 平台 都 支持 sync 和 fsync 函数 。 但 是 ,FreeBSD 8.0 不 支持 fdatasync。 


3.14 PAR Ecnt1 
fcntl 函数 可 以 改变 已 经 打开 文件 的 属性 。 


#include<fcnt1.h> 





int fentl(int fd, int cmd, ... /* int arg */); 
返回 值 ， 若 成 功 ， 则 依赖 于 cmd COE) ; 车 出 错 ， 返 回 -1 
在 本 节 的 各 实例 中 ， 第 3 个 参数 总 是 一 个 整数 ， 与 上 面 所 示 函 数 原型 中 的 注释 部 分 对 应 。 但 
是 在 14.3 节 说 明 记 录 锁 时 ， 第 3 个 参数 则 是 指向 一 个 结构 的 指针 。 
font] 函数 有 以 下 5 种 功能 。 
(1) 复制 一 个 已 有 的 描述 符 Cemd- F DUPFD BK F_DUPFD_CLOEXEC). 
(2) 获取 /设置 文件 描述 符 标志 (cmd=F_GETFD 或 F_SETFD)。 
(3) 获取 /设置 文件 状态 标志 (cmd==F_GETFL 或 F_SETFL)。 
(4) 获取 /设置 异步 IJO 所有权 (cmd=F_GETOWN 或 F_SETOWN)。 
(5) 获取 /设置 记录 锁 (cmd=F_GETLK、F_SETLK 或 F_SETLKW)。 
我 们 先 说 明 这 11 种 ema 中 的 前 8 种 (14.3 节 说 明 后 3 种 ， 它 们 都 与 记录 锁 有 关 )。 参 照 图 3-7， 我 
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们 将 讨论 与 进程 表 项 中 各 文件 描述 符 相 关联 的 文件 描述 符 标志 以 及 每 个 文件 表 项 中 的 文件 状态 标志 。 


F_DUPFD 


F_DUPFD_CLOEXEC 


F_GETFD 


F_SETFD 


复制 文件 描述 符 Jf4。 新 文件 描述 符 作 为 函数 值 返回 。 它 是 尚未 打开 的 
各 描述 符 中 大 于 或 等 于 第 3 个 参数 值 ( 取 为 整 型 值 ) 中 各 值 的 最 小 值 。 
新 描述 符 与 fd 共享 同一 文件 表 项 〈 见 图 3-9)。 但 是 ， 新 描述 符 有 它 
自己 的 一 套 文件 描述 符 标志 ， 其 FD_CLOEXEC 文件 描述 符 标 志 被 清 
除 〈 这 表示 该 描述 符 在 exec 时 仍 保持 有 效 ， 我 们 将 在 第 8 章 对 此 进 
行 讨 论 )。 

复制 文件 描述 符 ， 设 置 与 新 描述 符 关 联 的 FD CLOEXEC 文件 描述 符 标 
志 的 值 ， 返 回 新 文件 描述 符 。 

对 应 于 fa 的 文件 描述 符 标 志 作 为 函数 值 返 回 。 当 前 只 定义 了 一 个 文件 
描述 符 标 志 FD_CLOEXEC. 

对 于 局 设 置 文件 描述 符 标志 。 新 标志 值 按 第 3 SSR A RED 
设置 。 


要 知道 ， 很 多 现 有 的 与 文件 描述 符 标志 有 关 的 程序 并 不 使 用 常量 FD _ CLOEXEC， 而 是 将 此 标 
志 设 置 为 0 (系统 默认 ， 在 exec 时 不 关闭 ) 或 1( 在 exec 时 关闭 )。 


F GETFL 


XESCT fa 的 文件 状态 标志 作为 函数 值 返 回 。 我们 在 说 明 open 函数 时 ， 
已 描述 了 文件 状态 标志 。 它 们 列 在 图 3-10 中 。 


文件 状态 标志 


O_RDONLY 
O_WRONLY 
O_RDWR 
O_EXEC 
O_SEARCH 


O_APPEND 
O_NONBLOCK 
O_SYNC 
O_DSYNC 
O_RSYNC 
O_FSYNC 
O_ASYNC 


F_SETFL 


F_GETOWN 


只 读 打 开 

只 写 打开 

读 、 写 打开 

只 执行 打开 

只 搜索 打开 目录 

追加 写 

非 阻塞 模式 

等 待 写 完成 (数据 和 属性 ) 
等 待 写 完成 〈 仅 数据 ) 

同步 读 和 写 

等 待 写 完成 ( 仅 FreeBSD 和 Mac OS X) 
HP VO CX. FreeBSD fil Mac OS X) 


图 3-10 对 于 fcntl 的 文件 状态 标志 
遗憾 的 是 ,5 个 访问 方式 标志 (O_RDONLY、O_WRONLY、O_RDWR、O_EXEC 
LL o SEARCH) 并 不 各 占 1 位 (如 前 所 述 ， 由 于 历史 原因 ， 前 3 个 标 
志 的 值 分 别 是 0、1 和 2。 这 5 个 值 互 斥 ， 一 个 文件 的 访问 方式 只 能 取 
这 5 个 值 之 一 )。 因 此 首先 必须 用 屏蔽 字 0 ACCMODE 取得 访问 方式 位 ， 
然后 将 结果 与 这 5 个 值 中 的 每 一 个 相 比 较 。 
将 文件 状态 标志 设置 为 第 3 个 参数 的 值 〈( 取 为 整 型 值 )。 可 以 更 改 的 几 
个 标志 是 : O APPEND. O_NONBLOCK, O_SYNC, O_DSYNC, O_RSYNC, 
O FSYNC fll O ASYNC. 
获取 当前 接收 SIGIO 和 SIGURG 信号 的 进程 ID 或 进程 组 ID. 14.5.2 
节 将 论述 这 两 种 异步 IO 信号。 
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F_SETOWN 设置 接收 SIGIO 和 SIGURG 信号 的 进程 ID 或 进程 组 ID 。 正 的 arg 指 
定 一 个 进程 ID， 负 的 arg 表示 等 于 arg 绝对 值 的 一 个 进程 组 ID. 
fcntl 的 返回 值 与 命令 有 关 。 如 果 出 错 ， 所 有 命令 都 返回 一 1， 如 果 成 功 则 返回 某 个 其 他 值 。 
下 列 4 个 命令 有 特定 返回 值 : F DUPFD. F GETFD. F GETFL LJ F GETOWN. 58 1 个 命令 返回 
新 的 文件 描述 符 ， 第 2 个 和 第 3 个 命令 返回 相应 的 标志 ， 最 后 一 个 命令 返回 一 个 正 的 进程 ID 或 负 
的 进程 组 ID。 


m BA 


图 3-11 中 所 示 程 序 的 第 1 个 参数 指定 文件 描述 符 ， 并 对 于 该 描述 符 打 印 其 所 选择 的 文件 标 


#include "apue.h" 
#include «fcntl.h» 


int 
main(int argc, char *argv[]) 
( 


int val; 


if (argc != 2) 
err quit("usage: a.out <descriptor#>"); 


if ((val = fcntl(atoi(argv[1]), F GETFL, 0)) < 0) 
err sys("fcntl error for fd %d", atoi(argv[1])); 


switch (val & O ACCMODE) { 
case O RDONLY: 
printf ("read only"); 
break; 


case O WRONLY: 
printf("write only"); 
break; 


case O RDWR: 
printf ("read write"); 
break; 


default: 
err dump("unknown access mode"); 


! 


if (val & O APPEND) 
printf(", append"); 
if (val & O NONBLOCK) 


printf(", nonblocking"); 
if (val & O SYNC) 
printf(", synchronous writes"); 


#if !defined( POSIX C SOURCE) && defined(O FSYNC) && (O FSYNC !- O SYNC) 
if (val & O FSYNC) 
printf(", synchronous writes"); 
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#endif 


putchar('\n'); 
exit (0); 


图 3-11 对 于 指定 的 描述 符 打 印 文件 标志 
注意 ， 我 们 使 用 了 功能 测试 宏 _ PosIX_C_SOURCE， 并 且 条 件 编译 了 POSIX.1 中 没有 定义 的 


文件 访问 标志 。 下 面 显示 了 从 bash (Bourne-again shell) 调用 该 程序 时 的 几 种 情况 。 当 使 用 不 同 
shell 时 ， 结 果 会 有 些 不 同 。 


$./a.out 0 < /dev/tty 
read only 

$./a.out 1 > temp.foo 
$ cat temp.foo 

write only 

$./a.out 2 2>>temp.foo 
write only, append 
$./a.out 5 5<>temp.foo 
read write 


子 句 5<>temp . foo 表示 在 文件 描述 符 5 上 打开 文件 temp. foo 以 供 读 、 写 。 E 
中 实例 


在 修改 文件 描述 符 标志 或 文件 状态 标志 时 必须 谨慎 ， 先 要 获得 现在 的 标志 值 ， 然 后 按照 期 望 修改 


它 ， 最 后 设置 新 标志 值 。 不 能 只 是 执行 F_SETFD 或 F_SETFL 命令 ， 这 样 会 关闭 以 前 设置 的 标志 位 。 


图 3-12 是 对 于 一 个 文件 描述 符 设置 一 个 或 多 个 文件 状态 标志 的 函数 。 


#include "apue.h" 
#include «fcntl.h» 


void 
set fl(int fd, int flags) /* flags are file status flags to turn on */ 


{ 


int val; 


if ((val = fcntl(fd, F GETFL, 0)) < 0) 
err sys("fcntl F GETFL error"); 


val |= flags; /* turn on flags */ 


if (fcntl(fd, F SETFL, val) < 0) 
err sys("fcntl F SETFL error"); 








图 3-12 ”对 一 个 文件 描述 符 开启 一 个 或 多 个 文件 状态 标志 
如 果 将 中 间 的 一 条 语句 改 为 : 


val &= ~flags; /* turn flags off */ 


就 构成 另 一 个 函数 ， 我 们 称 为 clr_f1， 并 将 在 后 面 某 些 例子 中 用 到 它 。 此 语句 使 当前 文件 状态 
标志 值 val 与 flags 的 反 码 进行 逻辑 “与 "运算 。 
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如 果 在 图 3-5 程序 的 开始 处 加 上 下 面 一 行 以 调用 set_f1， 则 开启 了 同步 写 标志 。 
set fl(STDOUT FILENO, O SYNC); 


这 就 使 每 次 write 都 要 等 待 ， 直 至 数据 已 写 到 磁盘 上 再 返回 。 在 UNIX 系统 中 ， 通 常 write 只 
是 将 数据 排 入 队列 ， 而 实际 的 写 磁盘 操作 则 可 能 在 以 后 的 某 个 时 刻 进行 。 而 数据 库 系统 则 需要 使 
用 O_SYNC， 这 样 一 来 ， 当 它 从 write 返回 时 就 知道 数据 已 确实 写 到 了 磁盘 上 ， 以 免 在 系统 异 
常 时 产生 数据 丢失 。 

程序 运行 时 ， 设 置 O_SYNC 标志 会 增加 系统 时 间 和 时 钟 时 间 。 为 了 测试 这 一 点 ， 先 运行 图 3-5 程 
序 ， 它 从 一 个 磁盘 文件 中 将 492.6 MB 的 数据 复制 到 另 一 个 文件 。 然 后 ， 对 比 设置 了 0. SYNC 标志 的 
程序 ， 使 其 完成 同样 的 工作 。 在 使 用 exta 文件 系统 的 Linux 上 执行 上 述 操作 ， 得 到 的 结果 如 图 3-13 
所 示 。 


取 自 图 3-6 中 BUFFSIZE=4 096 的 读 时 间 
正常 写 到 磁盘 文件 


设置 0_SYNC 后 写 到 磁盘 文件 

写 到 磁盘 后 接着 调用 fdatasync 

写 到 磁盘 后 接着 调用 fsync 

设置 0_SYNC 后 写 到 磁盘 ， 接 着 调用 fsync 


图 3-13 在 Linux ext4 中 采用 各 种 同步 机 制 后 的 计时 结果 





图 3-13 中 的 6 行 都 是 在 BUFFSIZE 为 4096 字 节 时 测量 的 。 图 3-6 中 的 结果 所 测量 的 情 
况 是 读 一 个 磁盘 文件 ， 然 后 写 到 /dev/null， 所 以 没有 磁盘 输出 。 图 3-13 中 的 第 2 行 对 应 于 
读 一 个 磁盘 文件 ， 然 后 写 到 另 一 个 磁盘 文件 中 。 这 就 是 为 什么 图 3-13 中 第 1 行 与 第 2 行 有 差 
别 的 原因 。 在 写 磁盘 文件 时 ， 系 统 时 间 增 加 了 ， 其 原因 是 内 核 需要 从 进程 中 复制 数据 ， 并 将 
数据 排 入 队列 以 便 由 磁盘 驱动 器 将 其 写 到 磁盘 上 。 当 写 至 磁盘 文件 时 ， 我 们 期 望 时 钟 时 间 也 
会 增加 。 

当 支 持 同 步 写 时 ， 系 统 时 间 和 时 钟 时 间 应 当 会 显著 增加 。 但 从 第 3 行 可 见 ， 同 步 写 所 用 的 系 
统 时 间 并 不 比 延 迟 写 所 用 的 时 间 增 加 很 多 。 这 意味 着 要 么 Linux 操作 系统 对 延迟 写 和 同步 写 操作 
的 工作 量 相 同 (这 其 实 是 不 太 可 能 的 )， 要 么 O SYNC 标志 并 没有 起 到 期 望 的 作用 。 在 这 种 情况 
F, Linux 操作 系统 并 不 允许 我 们 用 fcnt1 RE o SYNC 标志 , 而 是 显示 失败 但 没有 返回 出 错 (但 
如 果 在 文件 打开 时 能 指定 该 标志 ， 我 们 还 是 应 该 遵 重 这 个 标志 的 )。 

最 后 3 行 中 的 时 钟 时 间 反 映 了 所 有 写 操作 写 入 磁盘 时 需要 的 附加 等 待 时 间 。 同 步 写 入 
文件 之 后 ， 我 们 希望 对 fsync 的 调用 并 不 会 产生 效果 。 这 种 情况 理应 在 图 3-13 中 的 最 后 
一 行 中 呈现 ， 但 既然 O_SYNC 标志 并 没有 起 到 预期 的 作用 ， 所 以 最 后 一 行 和 第 5 行 的 表现 
几乎 相同 。 

图 3-14 显示 了 在 采用 HFS 文件 系统 的 Mac OS X 10.6.8 上 运行 同样 的 测试 得 到 的 计时 结 
果 。 该 计时 结果 与 我 们 的 期 望 相符 : 同步 写 比 延迟 写 所 消耗 的 时 间 增 加 了 很 多 ， 而 且 在 同步 
写 后 再 调用 函数 fsync 并 不 产生 测量 结果 上 的 显著 差别 。 还 要 注意 的 是 ， 在 延迟 写 后 增加 一 
个 fsync 函数 调用 ， 测 量 结果 的 差别 也 不 大 。 其 可 能 原因 是 ， 在 向 某 个 文件 写 入 新 数据 时 ， 
操作 系统 已 经 将 以 前 写 入 的 数据 都 冲洗 到 了 磁盘 上 ， 所 以 在 调用 函数 fsync 时 只 需要 做 很 少 
的 工作 。 
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写 到 /dev/null 
正常 写 到 磁盘 文件 





设置 0_sYNC 后 写 到 磁盘 文件 
写 到 磁盘 后 接着 调用 fsync 
WH O_SYNC 后 写 到 磁盘 ， 接 着 调用 fsync 





3-14 ”在 MacOS X HFS 中 采用 各 种 同步 机 制 后 的 计时 结果 

比较 fsync 和 fdatasync， 两 者 都 更 新 文件 内 容 ， 用 了 o SYNC 标志 ， 每 次 写 入 文件 时 都 
更 新 文件 内 容 。 每 一 种 调用 的 性 能 依赖 很 多 因素 ， 包 括 底层 的 操作 系统 实现 、 磁 盘 驱 动 器 的 速度 
以 及 文件 系统 的 类 型 。 = 

在 本 例 中 ， 我 们 看 到 了 font] 的 必要 性 。 我 们 的 程序 在 一 个 描述 符 〈 标 准 输出 ) 上 进行 操作 ， 
但 是 根本 不 知道 由 shell 打开 的 相应 文件 的 文件 名 。 因 为 这 是 shell 打开 的 ， 因 此 不 能 在 打开 时 按 我 
们 的 要 求 设置 0_sYNc 标志 。 使 用 fcnt1， 我 们 只 需要 知道 打开 文件 的 描述 符 ， 就 可 以 修改 描述 符 的 
属性 。 在 讲解 非 阻塞 管道 时 〈15.2 节 ) 还 会 用 到 fcnt1， 因 为 对 于 管道 ， 我 们 所 知 的 只 有 其 描述 符 。 


3.15 AŽ ioctl 


ioctl 函数 一 直 是 VO 操作 的 杂 物 箱 。 不 能 用 本 章 中 其 他 函数 表示 的 VO 操作 通常 都 能 用 ioctl 
Aeg. fO UO 是 使 用 ioctl 最 多 的 地 方 CER 18 章 中 将 看 到 ，POSIX.1 已 经 用 一 些 单独 的 函 
数 代 替 了 终端 IO 操作 )。 


#include <unistd.h> /* System V */ 


#include <sys/ioctl.h> /* BSD and Linux */ 


int ioctl(int fd, int request, ...); 





返回 值 ， 若 出 错 ， 返 回 -1; 若 成 功 ， 返 回 其 他 值 
ioctl 函数 是 Single UNIX Specification 标准 的 一 个 扩展 部 分 ,以 便 处 理 STREAMS 设备 [Rago 
1993], 但 是 ， 在 SUSv4 中 已 被 移 至 弃 用 状态 。UNIX 系统 实现 用 它 进行 很 多 杂项 设备 操作 。 有 些 
实现 甚至 将 它 扩展 到 用 于 普通 文件 。 


我 们 所 示 的 函数 原型 对 应 于 POSIX.1，FreeBSD 8.0 和 Mac OS X 10.6.8 将 第 2 个 参数 声明 为 
unsigned long。 因 为 第 2 个 参数 总 是 头 文件 中 一 个 #defined 的 名 字 ， 所 以 这 种 细节 并 没有 
什么 影响 。 

对 于 ISO C 原型 ， 它 用 省 略 号 表示 其 余 参 数 。 但 是 ， 通 常 只 有 另外 一 个 参数 ， 它 常常 是 指向 
一 个 变量 或 结构 的 指针 。 

在 此 原型 中 ， 我 们 表示 的 只 是 ioctl 函数 本 身 所 要 求 的 头 文件 。 通常 ， 还 要 求 男 外 的 设 
备 专 用 头 文件 。 例 如 ， 除 POSIX.1 所 说 明 的 基本 操作 之 外 ， 终 端 IO 的 ioctl 命令 都 需要 头 
文件 <termios .h>。 

每 个 设备 驱动 程序 可 以 定义 它 自己 专用 的 一 组 ioctl 命令 ， 系 统 则 为 不 同 种 类 的 设备 提供 
通用 的 ioctl 命令 。 图 3-15 中 总 结 了 FreeBSD 支持 的 通用 ioctl 命令 的 一 些 类 别 。 
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得 标号 DIOxxx <sys/disklabel.h> 
文件 LO FIOxxx <sys/filio.h> 


Riar VO MTIOxxx <sys/mtio.h> 
套 接 字 VO SIOxxx <sys/sockio.h> 
终端 VO TIOxxx «sys/ttycom.h» 


图 3-15 FreeBSD 中 通用 的 ioctl 操作 
磁带 操作 使 我 们 可 以 在 磁带 上 写 一 个 文件 结束 标志 、 倒 带 、 越 过 指定 个 数 的 文件 或 记录 等 ， 
用 本 章 中 的 其 他 函数 (read、write、lseek 等 ) 都 难于 表示 这 些 操作 ， 所 以 ， 对 这 些 设 备 进 
行 操作 最 容易 的 方法 就 是 使 用 ioctl. 
在 18.12 节 中 将 说 明 使 用 ioctl 函数 获取 和 设置 终端 窗口 大 小 ，19.7 节 中 使 用 ioctl 函数 
访问 伪 终 端的 高 级 功能 。 


3.16 /dev/fd 





较 新 的 系统 都 提供 名 为 /dev/fq 的 目录 ， 其 目录 项 是 名 为 0、1、2 等 的 文件 。 打 开 文 件 
/dev/fd/n 等 效 于 复制 描述 符 n〔 假 定 描述 符 n 是 打开 的 )。 
/dev/fd 这 一 功能 是 由 Tom Duff 开发 的 ， 它 首先 出 现在 Research UNIX 系统 的 第 8 版 中 ， 
本 书 说 明 的 所 有 4 种 系统 (FreeBSD 8.0, Linux 3.2.0, Mac OS X 10.6.8 和 Solaris 10 ) 都 支持 这 一 
功能 。 它 不 是 POSIX.1 的 组 成 部 分 。 
在 下 列 函数 调用 中 : 
fd = open("/dev/fd/0", mode); 
大 多 数 系统 忽略 它 所 指定 的 modae， 而 另外 一 些 系统 则 要 求 mode 必须 是 所 引用 的 文件 (在 这 里 
是 标准 输入 ) 初始 打开 时 所 使 用 的 打开 模式 的 一 个 子 集 。 因 为 上 面 的 打开 等 效 于 
fd = dup(0); 
所 以 描述 符 0 和 fa 共享 同一 文件 表 项 〈 见 图 3-9)。 例 如 ， 若 描述 符 0 先前 被 打开 为 只 读 ， 那 么 
我 们 也 只 能 对 fq 进行 读 操作 。 即 使 系统 忽略 打开 模式 ， 而 且 下 列 调用 是 成 功 的 ; 
fd = open("/dev/fd/0", O_RDWR); 
我 们 仍然 不 能 对 fd 进行 写 操作 。 
Linux 实现 中 的 /dev/fd 是 个 例外 。 它 把 文件 描述 符 映 射 成 指向 底层 物理 文件 的 符号 链接 。 
例如 , 当 打 开 /dev/fd/0 时 , 事实 上 正在 打开 与 标准 输入 关联 的 文件 ,因此 返回 的 新 文件 描述 符 
的 模式 与 /dev/fd 文件 描述 符 的 模式 其 实 并 不 相关 。 
我 们 也 可 以 用 /devy/fd 作为 路 径 名 参数 调用 creat, 这 与 调用 open 时 用 O_CREAT 作为 第 
2 个 参数 作用 相同 。 例 如 ， 若 一 个 程序 调用 creat， 并 且 路 径 名 参数 是 /dev/fd/1， 那 么 该 程序 
仍 能 工作 。 
注意 ， 在 Linux 上 这 么 做 必须 非常 小 心 。 因 为 Linux 实现 使 用 指向 实际 文件 的 符号 链接 ， 在 
/dev/fd 文件 上 使 用 creat 会 导致 底层 文件 被 截断 。 
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Ft we Fe Be HE tH PR 4 4K /dev/stdin. /dev/stdout 和 /dev/stderr， 这 些 等 效 于 
/dev/fd/0、 /dev/fd/1 和 /dev/fd/2。 

/dev/£d 文件 主要 由 shell 使 用 ， 它 允许 使 用 路 径 名 作为 调用 参数 的 程序 ， 能 用 处 理 其 他 路 
径 名 的 相同 方式 处 理 标准 输入 和 输出 。 例 如 ，cat(1) 命 令 对 其 命令 行 参 数 采 取 了 一 种 特殊 处 理 ， 
它 将 单独 的 一 个 字符 “- ”解释 为 标准 输入 。 例 如 ; 


filter file2 | cat filel = file3 | lpr 


首先 cat 读 file1， 接 着 读 其 标准 输入 (也 就 是 filter file2 命令 的 输出 )， 然 后 读 file3, 
如 果 支 持 /dev/fd， 则 可 以 删除 cat 对 “-” 的 特殊 处 理 ， 于 是 我 们 就 可 键入 下 列 命令 行 : 


filter file2 | cat filel /dev/fd/0 file3 | lpr 


作为 命令 行 参数 的 “-” 特 指标 准 输入 或 标准 输出 ， 这 已 由 很 多 程序 采用 。 但 是 这 会 带 来 一 
些 问 题 ， 例 如 ， 如 果 用 “- ”指定 第 一 个 文件 ,那么 看 来 就 像 指定 了 命令 行 的 一 个 选项 。/dev/fd 
则 提高 了 文件 名 参数 的 一 致 性 ， 也 更 加 清晰 。 


3.17 小 结 


本 章 说 明了 UNIX 系统 提供 的 基本 VO 函数 。 因 为 read 和 write 都 在 内 核 执行 ， 所 以 称 
这 些 函 数 为 不 带 缓冲 的 IO 函数 。 在 只 使 用 read 和 write 情况 下 ， 我 们 观察 了 不 同 的 VO KE 
对 读 文件 所 需 时 间 的 影响 。 我 们 也 观察 了 许多 将 已 写 入 的 数据 冲洗 到 磁盘 上 的 方法 ， 以 及 它们 对 
应 用 程序 性 能 的 影响 。 

在 说 明 多 个 进程 对 同一 文件 进行 追加 写 操作 以 及 多 个 进程 创建 同一 文件 时 ， 本 章 介绍 了 
原子 操作 。 也 介绍 了 内 核 用 来 共享 打开 文件 信息 的 数据 结构 。 在 本 书 的 稍 后 还 将 涉及 这 些 数 
据 结 构 。 

我 们 还 介绍 了 ioct1 和 fcntl 函 数 ,本 书后 续 部 分 还 会 涉及 这 两 个 函数 。 第 14 章 还 将 fcnt1 
用 于 记录 锁 ， 第 18 章 和 第 19 章 将 ioctl 用 于 终端 设备 。 


习题 


3.1 ” 当 读 / 写 磁盘 文件 时 ， 本 章 中 描述 的 函数 确实 是 不 带 缓冲 机 制 的 吗 ? 请 说 明 原 因 。 

3.2 ”编写 一 个 与 3.12 节 中 dup2 功能 相同 的 函数 ， 要 求 不 调用 fonti 函数 ， 并 且 要 有 正确 的 出 
错 处 理 。 

3.3 ”假设 一 个 进程 执行 下 面 3 个 函数 调用 : 
fdl open(path, oflags); 


fd2 = dup(fd1); 
fd3 = open(path, oflags); 


画 出 类 似 于 图 3-9 的 结果 图 。 对 £entl 作用 于 fd1 Kik, F_SETFD 命令 会 影响 哪 一 个 文 
件 描述 符 ? F_SETFL We? 
3.4 ”许多 程序 中 都 包含 下 面 一 段 代 码 : 


dup2 (fd, 0); 
dup2 (fd, 1); 
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3.5 


3.0 





dup2 (fd, 2); 
if (fd > 2) 
close (fd); 
为 了 说 明 if 语句 的 必要 性 ， 假 设 fq 是 1， 画 出 每 次 调用 dup2 时 3 个 描述 符 项 及 相应 的 
文件 表 项 的 变化 情况 。 然 后 再 画 出 £a 为 3 的 情况 。 
在 Bourne shell, Bourne-again shell 和 Korn shell P, digit/>&digit2 表示 要 将 描述 符 digit! 
重 定向 至 描述 符 digit2 的 同一 文件 。 请 说 明 下 面 两 条 命令 的 区 别 。 
./a.out > outfile 2>&1 
./a.out 2>&1 > outfile 


(提示 : shell 从 左 到 右 处 理 命令 行 。) 
如 果 使 用 追加 标志 打开 一 个 文件 以 便 读 、 写 ， 能 和 否 仍 用 lseek 在 任 一 位 置 开 始 读 ? 能 和 否 用 
lseek 更 新 文件 中 任 一 部 分 的 数据 ?请 编写 一 段 程序 验证 。 


文件 和 目录 





4.1 引言 


上 一 章 我 们 说 明了 执行 IO 操作 的 基本 函数 ， 其 中 的 讨论 是 围绕 普通 文件 IO 进行 的 一 一 打开 
文件 、 读 文件 或 写 文 件 。 本 章 将 描述 文件 系统 的 其 他 特征 和 文件 的 性 质 。 我 们 将 从 stat 函数 开始 ， 
逐个 说 明 stat 结构 的 每 一 个 成 员 以 了 解 文件 的 所 有 属性 。 在 此 过 程 中 ,我 们 将 说 明 修 改 这 些 属性 
的 各 个 函数 〈 更 改 所 有 者 、 更 改 权 限 等 )， 还 将 更 详细 地 说 明 UNIX 文件 系统 的 结构 以 及 符号 链接 。 
本 章 最 后 介绍 对 目录 进行 操作 的 各 个 函数 ， 并 且 开 发 了 一 个 以 降序 遍历 目录 层次 结构 的 函数 。 


4.2 WM stat, fstat, fstatat 和 lstat 


本 章 主要 讨论 4 个 stat 函数 以 及 它们 的 返回 信息 。 


#include <sys/stat.h> 





int stat (const char *restrict pathname, struct stat *restrict buf); 
int fstat(int fd, struct stat *buf); 


int lstat(const char *restrict pathname, struct stat *restrict buf); 


int fstatat (int fd, const char *restrict pathname, struct stat *restrict buf, int flag); 


所 有 4 个 函数 的 返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 





-HH pathname, stat 函数 将 返回 与 此 命名 文件 有 关 的 信息 结构 。fstat 函数 获得 已 

在 描述 符 入 上 打开 文件 的 有 关 信 息 。lstat 函数 类 似 于 stat, 但 是 当 命名 的 文件 是 一 个 符号 
链接 时 , 1stat 返回 该 符号 链接 的 有 关 信 息 , 而 不 是 由 该 符号 链接 引用 的 文件 的 信息 。( 在 4.22 
节 中 ， 当 以 降序 遍历 目录 层次 结构 时 ， 需 要 用 到 1stat。4.17 节 将 更 详细 地 说 明 符 号 链接 。) 

fstatat 函数 为 一 个 相对 于 当前 打开 目录 Ch 应 参数 指向 ) 的 路 径 名 返回 文件 统计 信息 。 
flag 参数 控制 着 是 否 跟随 着 一 个 符号 链接 。 当 AT SYMLINK NOFOLLOW 标志 被 设置 时 , fstatat 
不 会 跟随 符号 链接 ， 而 是 返回 符号 链接 本 身 的 信息 。 否 则 ， 在 默认 情况 下 ， 返 回 的 是 符号 链接 所 
指向 的 实际 文件 的 信息 。 如 果 应 参数 的 值 是 AT_FDCWD， 并 且 pathname 参数 是 一 个 相对 路 径 名 ， 
fstatat 会 计算 相对 于 当前 目录 的 pathname 参数 。 WR pathname 是 一 个 绝对 路 径 , f4 参数 就 会 
被 忽略 。 这 两 种 情况 下 ， 根 据 flag 的 取 值 ，fstatat 的 作用 就 跟 stat 或 1stat 一 样 

第 2 个 参数 buf 是 一 个 指针 ， 它 指向 一 个 我 们 必须 提供 的 结构 。 函 数 来 填充 由 buf 指向 的 结 
构 。 结 构 的 实际 定义 可 能 随 具 体 实现 有 所 不 同 ， 但 其 基本 形式 是 : 


struct stat { 
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mode_t st_mode; /* file type & mode (permissions) */ 
ino_t st_ino; /* i-node number (serial number) */ 
dev_t st_dev; /* device number (file system) */ 
dev_t st_rdev; /* device number for special files */ 
nlink_t st_nlink; /* number of links */ 

uid_t st_uid; /* user ID of owner */ 

gid_t st_gid; /* group ID of owner */ 

off t st size; /* size in bytes, for regular files */ 
struct timespec st atime; /* time of last access */ 

struct timespec st mtime; /* time of last modification */ 
struct timespec st ctime; /* time of last file status change */ 
blksize t st blksize; /* best I/O block size */ 

blkcnt t st blocks; /* number of disk blocks allocated */ 


POSIX.1 未 要 求 st rdev. st blksize f st blocks ff, Single UNIX Specification XSI 
扩展 定义 了 这 些 字段 。 
timespec 结构 类 型 按照 秒 和 纳 秒 定义 了 时 间 ， 至 少 包括 下 面 两 个 字段 : 
time t tv sec; 
long tv nsec; 
在 2008 年 版 以 前 的 标准 中 ， 时 间 字 段 定 义 成 st_atime、st_mtime 以 及 st_ctime， 它 
们 都 是 time 七 类 型 的 (以 秒 来 表示 )。timespec 结构 提供 了 更 高 精度 的 时 间 玲 。 为 了 保持 兼 
容 性 ， 旧 的 名 字 可 以 定义 成 tv_sec 成 员 。 例 如 ，st_atime 可 以 定义 成 st atim.tv sec. 


TER, stat 结构 中 的 大 多 数 成 员 都 是 基本 系统 数据 类 型 〈 见 2.8 节 )。 我 们 将 说 明 此 结构 的 
每 个 成 员 以 了 解 文件 属性 。 
使 用 stat 函数 最 多 的 地 方 可 能 就 是 1s -1 命令 ， 用 其 可 以 获得 有 关 一 个 文件 的 所 有 


4.3 文件 类 型 


至 此 我 们 已 经 介绍 了 两 种 不 同 的 文件 类 型 : 普通 文件 和 目录 。UNIX 系统 的 大 多 数 文件 是 普 
通 文件 或 目录 ， 但 是 也 有 另外 一 些 文件 类 型 。 文 件 类 型 包括 如 下 几 种 。 

(1) 普通 文件 〈regular file)。 这 是 最 常用 的 文件 类 型 ， 这 种 文件 包含 了 某 种 形式 的 数据 。 至 
于 这 种 数据 是 文本 还 是 二 进 制 数据 ， 对 于 UNIX 内 核 而 言 并 无 区 别 。 对 普通 文件 内 容 的 解释 由 处 
理 该 文件 的 应 用 程序 进行 。 

一 个 值得 注意 的 例外 是 二 进 制 可 执行 文件 。 为 了 执行 程序 ， 内 核 必 须 理解 其 格式 。 所 
有 二 进 制 可 执行 文件 都 遵循 一 种 标准 化 的 格式 ， 这 种 格式 使 内 核能 够 确定 程序 文本 和 数据 
的 加 载 位 置 。 

(2) 目录 文件 〈directory file)。 这 种 文件 包含 了 其 他 文件 的 名 字 以 及 指向 与 这 些 文件 有 关 信 
息 的 指针 。 对 一 个 目录 文件 具有 读 权限 的 任 一 进程 都 可 以 读 该 目录 的 内 容 ， 但 只 有 内 核 可 以 直接 
写 目录 文件 。 进 程 必须 使 用 本 章 介 绍 的 函数 才能 更 改 目 录 。 

(3) 块 特殊 文件 (block special file)。 这 种 类 型 的 文件 提供 对 设备 〈 如 磁盘 ) 带 缓冲 的 访问 ， 
每 次 访问 以 固定 长 度 为 单位 进行 。 
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注意 ，FreeBSD 不 再 支持 块 特殊 文件 。 对 设备 的 所 有 访问 需要 通过 字符 特殊 文件 进行 。 


(4) 字符 特殊 文件 (character special file)。 这 种 类 型 的 文件 提供 对 设备 不 带 缓冲 的 访问 ， 每 
次 访问 长 度 可 变 。 系 统 中 的 所 有 设备 要 么 是 字符 特殊 文件 ， 要 么 是 块 特殊 文件 。 

(5) FIFO。 这 种 类 型 的 文件 用 于 进程 间 通 信 ， 有 时 也 称 为 命名 管道 (named pipe)。15.5 节 将 
对 其 进行 说 明 。 

(6) REF. 〈socket)。 这 种 类 型 的 文件 用 于 进程 间 的 网 络 通信 。 套 接 字 也 可 用 于 在 一 台 宿 主 
机 上 进程 之 间 的 非 网 络 通信 。 第 16 章 将 用 套 接 字 进 行进 程 间 的 通信 。 

(7) 符号 链接 (symbolic link)。 这 种 类 型 的 文件 指向 另 一 个 文件 。4.17 节 将 更 多 地 描述 符号 
链接 。 

文件 类 型 信息 包含 在 stat 结构 的 st_mode 成 员 中 。 可 以 用 图 4-1 中 的 宏 确 定 文件 类 型 。 这 

些 宏 的 参数 都 是 stat 结构 中 的 st_mode 成 员 。 


S ISREG() 普通 文件 
S_ISDIR() 目录 文件 


S ISCHR() 字符 特殊 文件 
S ISBLK() 块 特殊 文件 
S_ISFIFO() 管道 或 FIFO 
S ISLNK() 符号 链接 
S_ISSOCK () 套 接 字 


图 4-1 在 <sys/stat.h> 中 的 文件 类 型 宏 
POSIX.1 允许 实现 将 进程 间 通 信 CPC) 对 象 〈 如 消息 队列 和 信和 号 量 等 ) 说 明 为 文件 。 图 4-2 中 
的 宏 可 用 来 从 stat 结构 中 确定 IPC 对 象 的 类 型 。 这 些 宏 与 图 4-1 中 的 不 同 ， 它 们 的 参数 并 非 
st_modqe， 而 是 指向 stat 结构 的 指针 。 


S TYPEISMQ() 消息 队列 





S_TYPEISSEM () 信号 量 
S TYPEISSHM() 共享 存储 对 象 


图 4-2 在 <sys/stat.h> 中 的 IPC 类 型 宏 
消息 队列 、 信 和 号 量 以 及 共享 存储 对 象 等 将 在 第 15 章 中 讨论 。 但 是 ， 本 书 讨论 的 4 种 UNIX 
系统 都 不 将 这 些 对 象 表 示 为 文件 。 





上 实例 
图 4-3 程序 取 其 命令 行 参 数 ， 然 后 针对 每 一 个 命令 行 参数 打印 其 文件 类 型 。 


#include "apue.h" 


int 
main(int argc, char *argv[]) 
{ 

int iz 

struct stat buf; 

char *ptr; 
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for (ti = Lea < arger LH) d 
printf("*s: ", argv[i]); 
if (lstat(argv[i], &buf) < 0) { 
err ret("lstat error"); 
continue; 
} 
if (S ISREG(buf.st mode)) 
ptr = "regular"; 
else if (S ISDIR(buf.st mode)) 
ptr = "directory"; 
else if (S ISCHR(buf.st mode)) 
ptr - "character special"; 
else if (S ISBLK(buf.st mode)) 
ptr = "block special"; 
else if (S ISFIFO(buf.st mode)) 
ptr e "fifo"; 
else if (S ISLNK(buf.st mode)) 
ptr = "symbolic link"; 
else if (S ISSOCK(buf.st mode)) 
ptr = "socket"; 
else 
ptr = "** unknown mode **"; 
printf("$sMn", ptr); 
) 
exit(0); 


图 4-3 对 每 个 命令 行 参数 打印 文件 类 型 
图 4-3 程序 的 示例 输出 是 : 


$ ./a.out /etc/passwd /etc /dev/log /dev/tty \ 

> /var/lib/oprofile/opd pipe /dev/sr0 /dev/cdrom 
/etc/passwd: regular 

/etc: directory 

/dev/log: socket 

/dev/tty: character special 
/var/lib/oprofile/opd_pipe: fifo 

/dev/sr0: block special 

/dev/cdrom: symbolic link 


(其 中 ,在 第 一 个 命令 行 末 端 我 们 键入 了 一 个 反 斜 枉 ， 通 知 shell 要 在 下 一 行 继续 键入 命令 ， 然 后 ， 
shell 在 下 一 行 上 用 其 辅助 提示 符 > 提 示 我 们 。) 我 们 特地 使 用 了 1stat 函数 而 不 是 stat 函数 以 
便 检 测 符号 链接 。 如 若 使 用 stat 函数 ， 则 不 会 观察 到 符号 链接 。 * 

早期 的 UNIX 版 本 并 不 提供 S ISxxx X. 于 是 就 需要 将 st_mode 与 屏蔽 字 S_IFMT PETTY 
辑 “ 与 ”运算 ， 然 后 与 名 为 S_IFxxx 的 常量 相 比较 。 大 多 数 系统 在 文件 <sys/stat.h> 中 定义 
了 此 屏蔽 字 和 相关 的 常量 。 如 若 查 看 此 文件 ， 则 可 找到 S_ISDIR 宏 定 义 为 : 

#define S_ISDIR (mode) (((mode) & S_IFMT) == S_IFDIR) 

我 们 说 过 ， 普 通 文件 是 最 主要 的 文件 类 型 ， 但 是 观察 一 下 在 一 个 给 定 的 系统 中 各 种 文件 的 比 
例 是 很 有 意思 的 。 图 4-4 显示 了 在 一 个 单 用 户 工作 站 Linux 系统 中 的 统计 值 和 百分比 。 这 些 数据 
是 由 4.22 节 中 的 程序 得 到 的 。 
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图 4-4 不 同类 型 文件 的 统计 值 和 百分比 


4.4 设置 用 户 ID 和 设置 组 ID 


与 一 个 进程 相关 联 的 ID 有 6 个 或 更 多 ， 如 图 4-5 所 示 。 
实际 用 户 ID 
实际 组 ID 
有 效用 户 ID 


我 们 实际 上 是 谁 


有 效 组 ID 用 于 文件 访问 权限 检查 
附属 组 ID 
保存 的 设置 用 户 ID 
保存 的 设置 组 ID 





由 exec 函数 保存 


图 4-5 与 每 个 进程 相关 联 的 用 户 ID 和 组 ID 
。 实际 用 户 ID 和 实际 组 ID 标识 我 们 究竟 是 谁 。 这 两 个 字段 在 登录 时 取 自 口令 文件 中 的 登 
录 项 。 通 常 ， 在 一 个 登录 会 话 期 间 这 些 值 并 不 改变 ， 但 是 超级 用 户 进程 有 方法 改变 它们 ， 
8.11 节 将 说 明 这 些 方法 。 
。 有 效用 户 ID、 有 效 组 ID 以 及 附属 组 ID 决定 了 我 们 的 文件 访问 权限 ， 下 一 节 将 对 此 进行 
说 明 (我 们 已 在 1.8 节 中 说 明了 附属 组 ID )。 
。 保存 的 设置 用 户 ID 和 保存 的 设置 组 ID 在 执行 一 个 程序 时 包含 了 有 效用 户 DD 和 有 效 组 人 D 
的 副本 ， 在 8.11 节 中 说 明 setuid 函数 时 ， 将 说 明 这 两 个 保存 值 的 作用 。 
在 POSIX.1 2001 年 版 中 ， 要求 这 些 保存 的 ID。 在 早期 POSIX 版 本 中 ， 它 们 是 可 选 的 。 一 个 
应 用 程序 在 编译 时 可 测试 常量 POSIX_SRAVED_IDS， 或 在 运行 时 以 参数 SC SAVED IDS 调 
用 函数 sysconf， 以 判断 此 实现 是 否 支 持 这 一 功能 。 


通常 ， 有 效用 户 ID 等 于 实际 用 户 ID， 有 效 组 ID 等 于 实际 组 ID。 
每 个 文件 有 一 个 所 有 者 和 组 所 有 者 ， 所 有 者 由 stat 结构 中 的 st_uid 指定 ， 组 所 有 者 则 由 
st_gid 指定 。 

当 执 行 一 个 程序 文件 时 , 进程 的 有 效用 户 ID 通常 就 是 实际 用 户 ID, 有 效 组 ID 通常 是 实际 组 
ID。 但 是 可 以 在 文件 模式 字 (st mode) 中 设置 一 个 特殊 标志 ， 其 含义 是 “ 当 执 行 此 文件 时 ， 将 
进程 的 有 效用 户 ID 设置 为 文件 所 有 者 的 用 户 ID (st_uid) ”。 与 此 相 类 似 ,在 文件 模式 字 中 可 
以 设置 另 一 位 ， 它 将 执行 此 文件 的 进程 的 有 效 组 ID 设置 为 文件 的 组 所 有 者 ID (st_gid)。 在 文 
件 模 式 字 中 的 这 两 位 被 称 为 设置 用 户 ID (set-user-ID) 位 和 设置 组 ID (set-group-ID) 位 。 

例如 ， 若 文件 所 有 者 是 超级 用 户 ， 而 且 设 置 了 该 文件 的 设置 用 户 ID 位 ， 那 么 当 该 程序 文件 
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由 一 个 进程 执行 时 ， 该 进程 具有 超级 用 户 权 限 。 不 管 执 行 此 文件 的 进程 的 实际 用 户 ID 是 什么 ， 
都 会 是 这 样 。 例 如 ，UNIX 系统 程序 passwa(1) 允 许 任 一 用 户 改 变 其 口令 ， 该 程序 是 一 个 设置 用 
P ID 程序 。 因 为 该 程序 应 能 将 用 户 的 新 口令 写 入 口令 文件 中 (一 般 是 /etc/passwd 或 /etc/ 
shadow)， 而 只 有 超级 用 户 才 具 有 对 该 文件 的 写 权 限 ， 所 以 需要 使 用 设置 用 户 ID 功能 。 因 为 运 
行 设置 用 户 ID 程序 的 进程 通常 会 得 到 额外 的 权限 ， 所 以 编写 这 种 程序 时 要 特别 谨慎 。 第 8 章 将 
更 详细 地 讨论 这 种 类 型 的 程序 。 

再 回 到 stat 函数 ， 设 置 用 户 ID 位 及 设置 组 ID 位 都 包含 在 文件 的 st. mode 值 中 。 这 两 位 
可 分 别 用 常量 s_ISUID 和 S_ISGID Wik. 


4.5 文件 访问 权限 


st mode 值 也 包含 了 对 文件 的 访问 权限 位 。 当 提 及 文件 时 ,， 指 的 是 前 面 所 提 到 的 任何 类 型 的 
文件 。 所 有 文件 类 型 〈 目 录 、 字 符 特别 文件 等 ) 都 有 访问 权限 Caccess permission)。 很 多 人 认为 
只 有 普通 文件 有 访问 权限 ， 这 是 一 种 误解 。 

每 个 文件 有 9 个 访问 权限 位 ， 可 将 它们 分 成 3 类 ， 见 图 4-6。 





图 4-6 9 个 访问 权限 位 ， 取 自 <sys/stat.h> 
在 图 4-6 前 3 行 中 ， 术 语 用 户 指 的 是 文件 所 有 者 (owner)。chmod(1) 命 令 用 于 修改 这 9 个 权 
限 位 。 该 命令 允许 我 们 用 u 表示 用 户 (所 有 者 )， 用 g 表示 组 ， 用 o 表示 其 他 。 有 些 书 把 这 3 种 
用 户 类 型 分 别称 为 所 有 者 、 组 和 世界 。 这 会 造成 混乱 ， 因 为 chmod 命令 用 o 表示 其 他 ， 而 不 是 
所 有 者 。 我 们 将 使 用 术语 用 户 、 组 和 其 他 ， 以 便 与 chmod 命令 保持 一 致 。 
图 4-6 中 的 3 类 访问 权限 ( 即 读 、 写 及 执行 ) 以 各 种 方式 由 不 同 的 函数 使 用 。 我 们 将 这 些 不 
同 的 使 用 方式 汇总 在 下 面 。 当 说 明 相 关 函 数 时 ， 再 进一步 讨论 。 
。 第 一 个 规则 是 ， 我 们 用 名 字 打 开 任 一 类 型 的 文件 时 ， 对 该 名 字 中 包含 的 每 一 个 目录 ， 包 
括 它 可 能 隐 含 的 当前 工作 目录 都 应 具有 执行 权限 。 这 就 是 为 什么 对 于 目录 其 执行 权限 位 
常 被 称 为 搜索 位 的 原因 。 
例如 , 为 了 打开 文件 /usr/incliude/stdio.h, 需要 对 目录 /、/usr 和 /usr/include 
具有 执行 权限 。 然 后 ， 需 要 具有 对 文件 本 身 的 适当 权限 ， 这 取决 于 以 何 种 模式 打开 它 〈 只 
读 、 读 - 写 等 )。 
如 果 当 前 目录 是 /usr/include， 那 么 为 了 打开 文件 stdio.h， 需要 对 当前 目录 有 执行 
权限 。 这 是 隐 含 当前 目录 的 一 个 示例 。 打 开 stdio.h 文件 与 打开 . /stdio.h 作用 相同 。 
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注意 ， 对 于 目录 的 读 权限 和 执行 权限 的 意义 是 不 相同 的 。 读 权限 允许 我 们 读 目录 ， 获 得 在 
该 目录 中 所 有 文件 名 的 列表 。 当 一 个 目录 是 我 们 要 访问 文件 的 路 径 名 的 一 个 组 成 部 分 时 ， 
对 该 目录 的 执行 权限 使 我 们 可 通过 该 目录 (也 就 是 搜索 该 目录 ， 寻 找 一 个 特定 的 文件 名 )。 
引用 隐 含 目录 的 另 一 个 例子 是 ， 如 果 PATH 环境 变量 (8.10 节 将 对 其 进行 说 明 ) 指定 了 一 
个 我 们 不 具有 执行 权限 的 目录 ， 那 么 shel 绝 不 会 在 该 目录 下 找到 可 执行 文件 。 

。 对 于 一 个 文件 的 读 权 限 决定 了 我 们 是 否 能 够 打开 现 有 文件 进行 读 操作 。 这 与 open 函数 的 
O_RDONLY 和 O_RDWR 标志 相关 。 

。 对 于 一 个 文件 的 写 权 限 决定 了 我 们 是 否 能 够 打开 现 有 文件 进行 写 操作 。 这 与 open 函数 的 
O_WRONLY 和 O_RDWR 标志 相关 。 

e。 为 了 在 open 函数 中 对 一 个 文件 指定 0_TRUNC 标志 ， 必 须 对 该 文件 具有 写 权 限 。 

© 为 了 在 一 个 目录 中 创建 一 个 新 文件 ， 必 须 对 该 目录 具有 写 权 限 和 执行 权限 。 

。 为 了 删除 一 个 现 有 文件 ， 必 须 对 包含 该 文件 的 目录 具有 写 权 限 和 执行 权限 。 对 该 文件 本 

身 则 不 需要 有 读 、 写 权限 。 

e 如 果 用 7 个 exec 函数 〈 见 8.10 节 ) 中 的 任何 一 个 执行 某 个 文件 ， 都 必须 对 该 文件 具有 

执行 权限 。 该 文件 还 必须 是 一 个 普通 文件 。 

进程 每 次 打开 、 创 建 或 删除 一 个 文件 时 ， 内 核 就 进行 文件 访问 权限 测试 ， 而 这 种 测试 可 能 涉 
及 文件 的 所 有 者 (st_uid 和 st_gid)、 进 程 的 有 效 ID〈 有 效用 户 ID 和 有 效 组 ID ) 以 及 进程 的 
附属 组 ID (〈 若 支持 的 话 )。 两 个 所 有 者 ID 是 文件 的 性 质 ， 而 两 个 有 效 ID 和 附属 组 ID 则 是 进程 
的 性 质 。 内 核 进行 的 测试 具体 如 下 。 

C1) 若 进程 的 有 效用 户 ID 是 0 〈 超 级 用 户 )， 则 允许 访问 。 这 给 予 了 超级 用 户 对 整个 文件 系 
统 进行 处 理 的 最 充分 的 自由 。 

(2) 若 进 程 的 有 效用 户 ID 等 于 文件 的 所 有 者 ID (也 就 是 进程 拥有 此 文件 )， 那么 如 果 所 有 者 
适当 的 访问 权限 位 被 设置 ， 则 允许 访问 ， 否则 拒绝 访问 。 适当 的 访问 权限 位 指 的 是 ， 若 进程 为 读 
而 打开 该 文件 ， 则 用 户 读 位 应 为 1; 若 进程 为 写 而 打开 该 文件 ， 则 用 户 写 位 应 为 1; 若 进 程 将 执行 
该 文件 ， 则 用 户 执行 位 应 为 1。 

(3) 若 进程 的 有 效 组 ID 或 进程 的 附属 组 ID 之 一 等 于 文件 的 组 ID, 那么 如 果 组 适当 的 访问 权 
限 位 被 设置 ， 则 人 允许 访问 ， 和 否则 拒绝 访问 。 

(4) 若 其 他 用 户 适 当 的 访问 权限 位 被 设置 ， 则 允许 访问 ， 否则 拒绝 访问 。 

按 顺 序 执行 这 4 步 。 注 意 ， 如 果 进 程 拥 有 此 文件 (第 2 步 )， 则 按 用 户 访问 权限 批准 或 拒绝 
该 进程 对 文件 的 访问 不 查看 组 访问 权限 。 类 似 地 ， 若 进程 并 不 拥有 该 文件 。 但 进程 属于 某 个 
适当 的 组 ， 则 按 组 访问 权限 批准 或 拒绝 该 进程 对 文件 的 访问 一 一 不 查看 其 他 用 户 的 访问 权限 。 


4.6 ”新 文件 和 目录 的 所 有 权 


在 第 3 章 中 讲述 用 open 或 creat 创建 新 文件 时 ， 我 们 并 没有 说 明 赋予 新 文件 的 用 户 ID 和 
组 ID 是 什么 。4.21 节 将 说 明 mkdir 函数 ， 此 时 就 会 了 解 如 何 创 建 一 个 新 目录 。 关 于 新 目录 的 所 
有 权 规 则 与 本 节 将 说 明 的 新 文件 所 有 权 规 则 相同 。 

新 文件 的 用 户 ID 设置 为 进程 的 有 效用 户 ID。 关 于 组 ID，POSIX.1 允许 实现 选择 下 列 之 一 作 
为 新 文件 的 组 ID. 

(1) 新 文件 的 组 ID 可 以 是 进程 的 有 效 组 ID. 
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(2) 新 文件 的 组 ID 可 以 是 它 所 在 目录 的 组 ID。 


FreeBSD 8.0 和 Mac OS X 10.6.8 总 是 使 用 目录 的 组 ID 作为 新 文件 的 组 ID。 有 些 Linux 文件 
系统 使 用 mount(]) 命 令 选项 允许 在 POSIX.1 提出 的 两 种 选项 中 进行 选择 。 对 于 Linux 3.2.0 和 
Solaris 10, 默认 情况 下 ,新 文件 的 组 有 D 取决 于 它 所 在 的 目录 的 设置 组 ID 位 是 否 被 设置 。 如 果 该 目录 的 
这 一 位 已 经 被 设置 , 则 新 文件 的 组 ID 设置 为 目录 的 组 ID; 否则 新 文件 的 组 ID 设置 为 进程 的 有 效 组 ID。 


使 用 POSIX.1 所 允许 的 第 二 个 选项 (继承 目录 的 组 ID ) 使 得 在 某 个 目录 下 创建 的 文件 和 目录 
都 具有 该 目录 的 组 ID.。 于 是 文件 和 目录 的 组 所 有 权 从 该 点 向 下 传递 .例如 ,在 Linux 的 /var/mail 
目录 中 就 使 用 了 这 种 方法 。 
正如 前 面 提 到 的 ， 这 种 设置 组 所 有 权 的 方法 是 FreeBSD 8.0 和 Mac OS X 10.6.8 系统 默认 的 ， 
但 对 于 Linux 和 Solaris 则 是 可 选 的 。 在 Linux 3.2.0 和 Solaris 10 之 下 , 必须 使 设置 组 ID 位 起 作用 。 
更 进一步 ,为 使 这 种 方法 能 够 正常 工作 , mkdir 函数 要 自动 地 传递 一 个 目录 的 设置 组 ID 位 (4.21 
节 将 说 明 mkdir 就 是 这 样 做 的 )。 


4.7 AŽ access 和 faccessat 


正如 前 面 所 说 ， 当 用 open 函数 打开 一 个 文件 时 ， 内 核 以 进程 的 有 效用 户 ID 和 有 效 组 ID 
为 基础 执行 其 访问 权限 测试 。 有 时 ， 进 程 也 希望 按 其 实际 用 户 ID 和 实际 组 ID 来 测试 其 访问 能 
力 。 例 如 ， 当 一 个 进程 使 用 设置 用 户 ID 或 设置 组 ID 功能 作为 另 一 个 用 户 (或 组 ) 运行 时 ， 就 
可 能 会 有 这 种 需要 。 即 使 一 个 进程 可 能 已 经 通过 设置 用 户 ID 以 超级 用 户 权 限 运 行 , 它 仍 可 能 想 
验证 其 实际 用 户 能 和 否 访问 一 个 给 定 的 文件 。access 和 faccessat 函数 是 按 实际 用 户 ID 和 实 
际 组 ID 进行 访问 权限 测试 的 。( 该 测试 也 分 成 4 步 ， 这 与 4.5 节 中 所 述 的 一 样 ， 但 将 有 效 改 为 
实际 。) 





#include <unistd.h> 
int access(const char *pathname, int mode); 
int faccessat(int fd, const char *pathname, int mode, int flag); 
两 个 函数 的 返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 
其 中 ,如 果 测试 文件 是 否 已 经 存在 ，mode RH F OK; 否则 mode 是 图 4-7 中 所 列 常量 的 按 位 或 。 








测试 读 权 限 


测试 写 权 限 
测试 执行 权限 
图 4-7 access 函数 的 mode 标志 ， 取 自 <unistd.h> 
faccessat MBM access 函数 在 下 面 两 种 情况 下 是 相同 的 : 一 种 是 pathname 参数 为 绝对 
路 径 ， 另 一 种 是 fd 参数 取 值 为 AT_FDCWD 而 pathname 参数 为 相对 路 径 。 和 否则 ，faccessat it 
算 相对 于 打开 目录 〈 由 应 参数 指向 ) 的 pathname. 
flag 参数 可 以 用 于 改变 faccessat 的 行为 ， 如 果 flag 设置 为 AT_EACCESS， 访问 检查 用 的 
是 调用 进程 的 有 效用 户 ID 和 有 效 组 ID， 而 不 是 实际 用 户 ID 和 实际 组 ID. 
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a SPI 


图 4-8 显示 了 access 函数 的 使 用 方法 。 





#include "apue.h" 
#include «fcntl.h» 


int 


main(int argc, char *argv[]) 


{ 


if (argc != 2) 
err quit("usage: a.out <pathname>"); 
if (access(argv[1], R OK) < 0) 
err ret("access error for %s", argv[1]); 
else 
printf("read access OKMn"); 
if (open(argv[1], O RDONLY) « 0) 
err ret("open error for $s", argv[1]); 


else 
printf("open for reading OK\n"); 
exit(0); 
4-8 access 函数 实例 
下 面 是 该 程序 的 示例 会 话 : 
$ 1s -l a.out 
-rwxrwxr-x 1 sar 15945 Nov 30 12:10 a.out 


$ ./a.out a.out 

read access OK 

open for reading OK 

$ ls -1 /etc/shadow 

-r-------- 1 root 1315 Jul 17 2002 /etc/shadow 
$ ./a.out /etc/shadow 

access error for /etc/shadow: Permission denied 

open error for /etc/shadow: Permission denied 


$ su 成 为 超级 用 户 

Password: 输入 超级 用 户口 令 

# chown root a.out 将 文件 用 户 ID 改 为 root 

# chmod u+s a.out 并 打开 设置 用 户 ID 位 

# 1s -l a.out 检查 所 有 者 和 SUID 位 
-rwsrwxr-x 1 root 15945 Nov 30 12:10 a.out 
# exit 恢复 为 正常 用 户 


$ ./a.out /etc/shadow 
access error for /etc/shadow: Permission denied 
open for reading OK 


在 本 例 中 , 尽管 open 函数 能 打开 文件 , 但 通过 设置 用 户 ID 程序 可 以 确定 实际 用 户 不 能 正当 


读 指定 的 文件 。 a 


在 上 例 及 第 8 章 中 ， 我 们 有 时 要 成 为 超级 用 户 ， 以 便 演 示 某 些 功能 是 如 何 工 作 的 。 如 果 你 使 
用 多 用 户 系 统 ， 但 无 超级 用 户 权限 ， 那 么 你 就 不 能 完整 地 重复 这 些 实 例 。 


48 函数 umask 83 








4.8 PAR umask 


至 此 我 们 已 说 明了 与 每 个 文件 相关 联 的 9 个 访问 权限 位 ， 在 此 基础 上 我 们 可 以 说 明 与 每 个 进 
程 相关 联 的 文件 模式 创建 屏蔽 字 。 

umask 函数 为 进程 设置 文件 模式 创建 屏蔽 字 ， 并 返回 之 前 的 值 。( 这 是 少数 几 个 没有 出 错 返 
回 函数 中 的 一 个 。) 


#include <sys/stat.h> 


mode t umask (mode t cmask) ; 





返回 值 : 之 前 的 文件 模式 创建 屏蔽 字 


其 中 ， 参 数 cmask 是 由 图 4-6 中 列 出 的 9 个 常量 (S_IRUSR, S_IWUSR 等 ) 中 的 若干 个 按 位 
“或 ”构成 的 。 

在 进程 创建 一 个 新 文件 或 新 目录 时 ， 就 一 定 会 使 用 文件 模式 创建 屏蔽 字 (回忆 3.3 节 和 3.4 
节 ， 在 那里 我 们 说 明了 open 和 creat 函数 。 这 两 个 函数 都 有 一 个 参数 mode， 它 指定 了 新 文件 
的 访问 权限 位 )。 我 们 将 在 4.21 节 说 明 如 何 创建 一 个 新 目录 。 在 文件 模式 创建 屏蔽 字 中 为 1 的 位 ， 
在 文件 mode 中 的 相应 位 一 定 被 关闭 。 


Esi 


图 4-9 程序 创建 了 两 个 文件 ， 创 建 第 一 个 时 ，umask 值 为 0， 创 建 第 二 个 时 ，umask 值 禁止 
所 有 组 和 其 他 用 户 的 访问 权限 。 


#include "apue .hy" 
#include «fcntl.h» 





#define RWRWRW (S_IRUSR|S_IWUSR|S_IRGRP|S_IWGRP|S_IROTH|S_IWOTH) 


int 
main (void) 
{ 
umask (0) ; 
if (creat ("foo", RWRWRW) < 0) 
err_sys("creat error for foo"); 
umask(S_IRGRP | S_IWGRP | S_IROTH | S_IWOTH); 
if (creat("bar", RWRWRW) < 0) 
err_sys("creat error for bar"); 
exit (0); 


图 4-9 umask 函数 实例 
若 运行 此 程序 可 得 如 下 结果 ， 从 中 可 见 访问 权限 位 是 如 何 设 置 的 。 


$ umask 先 打印 当前 文件 模式 创建 屏蔽 字 
002 

$ ./a.out 

$ ls -1 foo bar 

—rWeee——--— 1 sar 0 Dec 7 21:20 bar 


-rw-rw-rw- 1 sar 0 Dec 7 21:20 foo 
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$ umask 观察 文件 模式 创建 屏蔽 字 是 否 更 改 

002 E 

UNIX 系统 的 大 多 数 用 户 从 不 处 理 他 们 的 umask 值 。 通 常 在 登录 时 ， 由 shel 的 启动 文件 设 
置 一 次 ， 然 后 ， 再 不 改变 。 尽 管 如 此 ， 当 编写 创建 新 文件 的 程序 时 ， 如 果 我 们 想 确保 指定 的 访问 
权限 位 已 经 激活 ， 那 么 必须 在 进程 运行 时 修改 umask 值 。 例 如 ， 如 果 我 们 想 确保 任何 用 户 都 能 
读 文件 ， 则 应 将 umask 设置 为 0。 否则 ， 当 我 们 的 进程 运行 时 ， 有 效 的 umask 值 可 能 关闭 该 权 
限 位 。 

在 前 面 的 示例 中 , 我 们 用 shell 的 umask 命令 在 运行 程序 的 前 、 后 打印 文件 模式 创建 屏蔽 字 。 
从 中 可 见 , 更 改进 程 的 文件 模式 创建 屏蔽 字 并 不 影响 其 父 进 程 ( 常 常 是 shell) 的 屏蔽 字 。 所 有 shell 
都 有 内 置 umask 命令 ， 我 们 可 以 用 该 命令 设置 或 打印 当前 文件 模式 创建 屏蔽 字 。 

用 户 可 以 设置 umask 值 以 控制 他 们 所 创建 文件 的 默认 权限 。 该 值 表 示 成 八进制 数 ， 一 位 
代表 一 种 要 屏蔽 的 权限 ， 这 示 于 图 4-10 中 。 设 置 了 相应 位 后 ， 它 所 对 应 的 权限 就 会 被 拒绝 。 
常用 的 几 种 umask 值 是 002. 022 和 027. 002 阻止 其 他 用 户 写 入 你 的 文件 ，022 阻止 同 组 
成 员 和 其 他 用 户 写 入 你 的 文件 , 027 阻止 同 组 成 员 写 你 的 文件 以 及 其 他 用 户 读 、 写 或 执行 你 的 
文件 。 





图 4-10 umask 文件 访问 权限 位 


Single UNIX Specification 要 求 shell 应 该 支持 符号 形式 的 umask 命令 。 与 八进制 格式 不 同 ， 
符号 格式 指定 许可 的 权限 《〈 即 在 文件 创建 屏蔽 字 中 为 0 的 位 ) 而 非 拒绝 的 权限 〈 即 在 文件 创建 屏 
Worm 1 的 位 )。 下 面 显示 了 两 种 格式 的 命令 。 


$ umask FFT En 24 BU SC PERO BU EE BE CE 
002 

$ umask -S 打印 符号 格式 

u=rwx, g=rwx, O=rx 

$ umask 027 更 改 文件 模式 创建 屏蔽 字 

$ umask -S 打印 符号 格式 


u=rwx, g=rx, O= 


4.9 PAR chmod, fchmod 和 fchmodat 


chmod. fchmod 和 fchmodat 这 3 个 函数 使 我 们 可 以 更 改 现 有 文件 的 访问 权限 。 


#include <sys/stat.h> 
int chmod(const char *pathname, mode t mode) ; 
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int fchmod(int fd, mode_t mode) ; 





int fchmodat (int fd, const char *pathname, mode_t mode, int flag); 
3 个 函数 返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 

chmod 函数 在 指定 的 文件 上 进行 操作 ， 而 fchmod 函数 则 对 已 打开 的 文件 进行 操作 。 
fchmodat 图 数 与 chmod 函数 在 下 面 两 种 情况 下 是 相同 的 : 一 种 是 pathname 参数 为 绝对 路 径 ， 
男 一 种 是 入 参数 取 值 为 AT_FDCWD 而 pathname 参数 为 相对 路 径 。 和 否则 ，fchmodat 计算 相对 于 
打开 目录 (由 fa 参 数 指向 ) 的 pathname. flag 参数 可 以 用 于 改变 fchmodat 的 行为 ， 当 设置 了 
AT SYMLINK NOFOLLOW 标志 时 ，fchmodat 并 不 会 跟随 符号 链接 。 

为 了 改变 一 个 文件 的 权限 位 ， 进 程 的 有 效用 户 ID 必须 等 于 文件 的 所 有 者 ID， 或 者 该 进程 必 
须 具 有 超级 用 户 权限 。 

参数 mode 是 图 4-11 中 所 示 常 量 的 按 位 或 。 











S_ISUID 执行 时 设置 用 户 ID 
S_ISGID 执行 时 设置 组 ID 
S_ISVTX 保存 正文 〈 粘 着 位 ) 
用 户 (所 有 者 ) 读 、 写 和 执 
i 

S_IRUSR 用 户 (所 有 者 ) 读 

S_IWUSR 用 户 (所 有 者 ) 写 

S_IXUSR 用 户 〈 所 有 者 ) 执行 
S IRWXG 

S IRGRP 

S IWGRP 

S IXGRP 
S IRWXO 

S IROTH 

S IWOTH 

S IXOTH 


图 4-11 chmod 函数 的 mode 常量 ， 取 自 <sys/stat.h> 
注意 ， 在 图 4-11 中 ， 有 9 项 是 取 自 图 4-6 中 的 9 个 文件 访问 权限 位 。 我 们 另外 加 了 6 个 ， 它 
们 是 两 个 设置 ID 常量 (S_ISUID 和 S_ISGID)、 保 存 正文 常量 (S_ISVTX) 以 及 3 个 组 合 常量 
(S IRWXU. S_IRWXG 和 S_IRWXO). 


S IRWXU 





保存 正文 位 (S_ISVTX ) 不 是 POSIX.1 的 一 部 分 。 在 Single UNIX Specification 中 ， 它 被 定义 
在 XSI 扩展 中 。 我 们 在 下 一 节 说 明 其 目的 。 


实例 
为 了 演示 umask 函数 ， 我 们 在 前 面 运 行 了 图 4-9 程序 ， 先 让 我 们 回忆 文件 foo M bar 当时 
的 最 后 状态 : 
$ ls -l foo bar 


SW 1 sar 0 Dec 7 21:20 bar 
-rw-rw-rw- 1 sar 0 Dec 7 21:20 foo 
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图 4-12 的 程序 修改 了 这 两 个 文件 的 模式 。 


#include "apue.h" 


int 
main (void) 
{ 
struct stat statbuf; 


/* turn on set-group-ID and turn off group-execute */ 


if (stat("foo", &statbuf) < 0) 
err_sys("stat error for foo"); 

if (chmod("foo", (statbuf.st mode & ~S_IXGRP) | S ISGID) < 0) 
err sys("chmod error for foo"); 


/* set absolute mode to "rw-r--r--" */ 
if (chmod("bar", S IRUSR | S IWUSR | S IRGRP | S IROTH) < 0) 


err sys("chmod error for bar"); 
exit(0); 


4-12. chmod 函数 实例 


在 运行 图 4-12 程序 后 ， 这 两 个 文件 的 最 后 状态 是 : 


$ ls -1 foo bar 
-rw-r--r-- 1 sar 0 Dec 7 21:20 bar 
-rw-rwSrw- 1 sar 0 Dec 7 21:20 foo 


在 本 例 中 ， 不 管 文件 bar 的 当前 权限 位 如 何 ， 我 们 都 将 其 权限 设置 为 一 个 绝对 值 。 对 文件 foo, 
我 们 相对 于 其 当前 状态 设置 权限 。 为 此 ， 先 调用 stat 获得 其 当前 权限 ， 然 后 修改 它 。 我 们 显 式 
地 打开 了 设置 组 ID 位 、 关 闭 了 组 执行 位 。 注 意 ，1s 命令 将 组 执行 权限 表示 为 S， 它 表示 设置 组 
ID 位 已 经 设置 ， 同 时 ， 组 执行 位 未 设置 。 


在 Solaris 'P, 1s 命令 显示 1 而 非 S， 这 表明 对 该 文件 可 以 加 强制 性 文件 或 记录 锁 。 这 只 能 
用 于 普通 文件 ，14.3 节 将 更 详细 地 讨论 这 一 点 。 gi 


最 后 还 要 注意 , 在 运行 图 4-12 程序 后 ，1s 命令 列 出 的 时 间 和 日 期 并 没有 改变 。 在 4.19 节 中 ， 
我 们 会 了 解 到 chmod 函数 更 新 的 只 是 i 节点 最 近 一 次 被 更 改 的 时 间 。 按 系统 默认 方式 ，1s -1 
列 出 的 是 最 后 修改 文件 内 容 的 时 间 。 

chmod 函数 在 下 列 条 件 下 自动 清除 两 个 权限 位 。 

« Solaris 等 系统 对 用 于 普通 文件 的 粘着 位 赋予 了 特殊 含义 ， 在 这 些 系统 上 如 果 我 们 试图 设 

置 普通 文件 的 粘着 位 〈S_ISVTX)， 而 且 又 没有 超级 用 户 权 限 ， 那 么 mode 中 的 粘着 位 自 
动 被 关闭 〈 我 们 将 在 下 一 节 说 明 粘 着 位 )。 这 意味 着 只 有 超级 用 户 才能 设置 普通 文件 的 粘 
着 位 。 这 样 做 的 理由 是 防止 恶意 用 户 设 置 粘 着 位 ， 由 此 影响 系统 性 能 。 


Æ FreeBSD 8.0 和 Solaris 10 中 ， 只 有 超级 用 户 才能 对 普通 文件 设置 粘着 位 。Linux 3.2.0 
和 Mac OS X 10.6.8 对 设置 粘着 位 并 无 此 种 限制 , 其 原因 是 , 粘着 位 对 Linux 普通 文件 并 无 意 
3X2 虽然 粘着 位 对 FreeBSD 的 普通 文件 也 无 意义 , 但 还 是 阻止 除 超 级 用 户 以 外 的 任何 用 户 对 
普通 文件 设置 该 位 。 
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。 新 创建 文件 的 组 ID 可 能 不 是 调用 进程 所 属 的 组 。 回 忆 一 下 4.6 节 ， 新 文件 的 组 ID 
可 能 是 父 目 录 的 组 ID。 特 别 地 ， 如 果 新 文件 的 组 ID 不 等 于 进程 的 有 效 组 ID 或 者 进 
程 附属 组 ID 中 的 一 个 ， 而 且 进 程 没有 超级 用 户 权 限 ， 那 么 设置 组 ID 位 会 被 自动 被 
关闭 。 这 就 防止 了 用 户 创建 一 个 设置 组 ID 文件 ,而 该 文件 是 由 并 非 该 用 户 所 属 的 组 
拥有 的 。 


这 种 情况 下 ，FreeBSD 8.0 对 试图 设置 组 ID 的 操作 肯定 会 返回 失败 ， 而 其 他 的 系统 则 无 
声息 地 关闭 该 位 ， 但 不 会 对 试图 改变 文件 访问 权限 的 操作 直接 做 失败 处 理 。 

FreeBSD 8.0, Linux 3.2.0, Mac OS X 10.6.8 和 Solaris 10 增加 了 另 一 个 安全 性 功能 以 试 
图 阻止 误 用 某 些 保护 位 。 如 果 没 有 超级 用 户 权限 的 进程 写 一 个 文件 ， 则 设置 用 户 ID 位 和 设 
置 组 ID 位 会 被 自动 清除 。 如 果 恶 意 用 户 找到 一 个 他 们 可 以 写 的 设置 组 ID 和 设置 用 户 ID X 
件 ， 即 使 可 以 修改 此 文件 ， 他 们 也 没有 对 该 文件 的 特殊 权限 。 


4.10 粘着 位 


S ISVTX 位 有 一 段 有 趣 的 历史 。 在 UNIX 尚未 使 用 请 求 分 页 式 技术 的 早期 版 本 中 ,，S_ISVTX 
位 被 称 为 粘着 位 〈sticky bit)。 如 果 一 个 可 执行 程序 文件 的 这 一 位 被 设置 了 ， 那 么 当 该 程序 第 一 次 
被 执行 , 在 其 终止 时 , 程序 正文 部 分 的 一 个 副本 仍 被 保存 在 交换 区 (程序 的 正文 部 分 是 机 器 指令 )。 
这 使 得 下 次 执行 该 程序 时 能 较 快 地 将 其 装载 入 内 存 。 其 原因 是 : 通常 的 UNIX 文件 系统 中 ， 文 件 
的 各 数据 块 很 可 能 是 随机 存放 的 ， 相 比较 而 言 ， 交 换 区 是 被 作为 一 个 连续 文件 来 处 理 的 。 对 于 通 
用 的 应 用 程序 ,如 文本 编辑 程序 和 C 语言 编译 器 , 我 们 常常 设置 它们 所 在 文件 的 粘着 位 。 自 然 地 ， 
对 于 在 交换 区 中 可 以 同时 存放 的 设置 了 粘着 位 的 文件 数 是 有 限制 的 ， 以 免 过 多 占用 交换 区 空间 ， 
但 无 论 如 何 这 是 一 个 有 用 的 技术 。 因 为 在 系统 再 次 自 举 前 ， 文 件 的 正文 部 分 总 是 在 交换 区 中 ， 这 
正 是 名 字 中 “粘着 ”的 由 来 。 后 来 的 UNIX 版 本 称 它 为 保存 正文 位 (saved-text bit)， 因 此 也 就 有 
了 常量 S_ISVTX。 现 今 较 新 的 UNIX 系统 大 多 数 都 配置 了 虚拟 存储 系统 以 及 快速 文件 系统 ， 所 以 
不 再 需要 使 用 这 种 技术 。 

现今 的 系统 扩展 了 粘着 位 的 使 用 范围 ，Single UNIX Specification 允许 针对 目录 设置 粘着 位 。 
如 果 对 一 个 目录 设置 了 粘着 位 ， 只 有 对 该 目录 具有 写 权 限 的 用 户 并 且 满 足下 列 条 件 之 一 ， 才 能 删 
除 或 重 命名 该 目录 下 的 文件 : 

。 拥有 此 文件 ; 

. 拥有 此 目录 ; 

。 是 超级 用 户 。 

目录 /tmp 和 /var/tmp 是 设置 粘着 位 的 典型 候选 者 一 一 任何 用 户 都 可 在 这 两 个 目录 
中 创建 文件 。 任 一 用 户 (用 户 、 组 和 其 他 ) 对 这 两 个 目录 的 权限 通常 都 是 读 、 写 和 执行 。 
但 是 用 户 不 应 能 删除 或 重 命名 属于 其 他 人 的 文件 ， 为 此 在 这 两 个 目录 的 文件 模式 中 都 设置 
了 粘着 位 。 

POSIX.1 没有 定义 保存 正文 位 , Single UNIX Specification 将 它 定 义 在 XSI 扩展 部 分 。 FreeBSD 
8.0、Linux 3.2.0, Mac OS X 10.6.8 和 Solaris 10 则 支持 这 种 功能 。 
在 Solaris 10 中 ， 如 果 对 普通 文件 设置 了 粘着 位 ， 那 么 它 就 具有 特殊 含义 。 在 这 种 情况 下 ， 如 
果 任 何 执行 位 都 没有 设置 ， 那 么 操作 系统 就 不 会 缓存 文件 内 容 。 
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4.11 PAH chown, fchown, fchownat 和 lchown 


下 面 儿 个 chown 函数 可 用 于 更 改 文件 的 用 户 ID 和 组 ID. 如 果 两 个 参数 owner 或 group 中 的 
任意 一 个 是 -1， 则 对 应 的 ID 不 变 。 


#include <unistd.h> 





int chown(const char *pathname, uid t owner, gid_t group); 
int fchown(int fd, uid t owner, gid t group); 
int fchownat(int fd, const char *pathname, uid t owner, gid t group, int flag); 
int lchown(const char *pathname, uid t owner, gid t group); 
4 个 函数 的 返回 值 ， 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 
除了 所 引用 的 文件 是 符号 链接 以 外 ， 这 4 个 函数 的 操作 类 似 。 在 符号 链接 情况 下 ，1chown 
和 fchownat (设置 了 AT_SYMLINK_NOFOLLOW 标志 ) 更 改 符号 链接 本 身 的 所 有 者 ， 而 不 是 该 
符号 链接 所 指向 的 文件 的 所 有 者 。 
fchown 消 数 改变 4 参数 指向 的 打开 文件 的 所 有 者 ， 既 然 它 在 一 个 已 打开 的 文件 上 操作 ， 就 
不 能 用 于 改变 符号 链接 的 所 有 者 。 
fchownat 函数 与 chown 或 者 1chown 函数 在 下 面 两 种 情况 下 是 相同 的 : 一 种 是 pathname 
参数 为 绝对 路 径 ， 另 一 种 是 ,应 参数 取 值 为 AT_FDCWD 而 pathname 参数 为 相对 路 径 。 在 这 两 种 情 
iF, 如果 flag 参数 中 设置 了 AT_SYMLINK_NOFOLLOW 标志 ，fchownat 与 1chown 行为 相同 ， 
如 果 flag 参数 中 清除 了 AT SYMLINK NOFOLLOW 标志 ， 则 fchownat 与 chown 行为 相同 。 如 
R fd 参数 设置 为 打开 目录 的 文件 描述 符 ， 并 且 pathname 参数 是 一 个 相对 路 径 名 ，fchownat HR 
数 计算 相对 于 打开 目录 的 pathname. 
基于 BSD 的 系统 一 直 规 定 只 有 超级 用 户 才能 更 改 一 个 文件 的 所 有 者 。 这 样 做 的 原因 是 防止 用 
户 改变 其 文件 的 所 有 者 从 而 摆脱 磁盘 空间 限额 对 他 们 的 限制 。System V 则 允许 任 一 用 户 更 改 他 们 
所 拥有 的 文件 的 所 有 者 。 


按照 _POSIX_CHOWN_RESTRICTED 的 值 ，POSIX.1 允许 在 这 两 种 形式 的 操作 中 选用 一 种 。 
对 于 Solaris 10， 此 功能 是 个 配置 选项 ， 其 默认 值 是 施加 限制 。 而 FreeBSD 8.0、Linux 3.2.0 
和 MacOSX 10.6.8 则 总 对 chown 施加 限制 。 


回忆 2.6 节 ，_POSIX_CHOWN_RESTRICTED 常量 可 选 地 定义 在 头 文件 <unistd.h> 中 ， 而 且 
总 是 可 以 用 pathconf 或 fpathconf 函数 进行 查询 。 此 选项 还 与 所 引用 的 文件 有 关 一 一 可 在 每 个 
文件 系统 基础 上 ， 使 该 选项 起 作用 或 不 起 作用 。 在 下 文中 ， 如 提 及 “ 若 _POSIX_CHOWN 
RESTRICTED “ERK” , 则 表示 “这 适用 于 我 们 正在 谈 及 的 文件 ”, 而 不 管 该 实际 常量 是 否 在 头 文件 
中 定义 。 

di POSIX CHOWN RESTRICTED 对 指定 的 文件 生效 ， 则 

(1) 只 有 超级 用 户 进程 能 更 改 该 文件 的 用 户 ID: 

(2) 如 果 进 程 拥 有 此 文件 (其 有 效用 户 ID 等 于 该 文件 的 用 户 ID )， 参 数 owner 等 于 -1 或 文 
件 的 用 户 ID， 并且 参数 group 等 于 进程 的 有 效 组 ID 或 进程 的 附属 组 ID 之 一 , 那么 一 个 非 超级 用 
户 进程 可 以 更 改 该 文件 的 组 ID。 
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这 意味 着 ， 当 _POSIX_CHOWN_RESTRICTED 有 效 时 ， 不 能 更 改 其 他 用 户 文件 的 用 户 ID。 你 
可 以 更 改 你 所 拥 用 的 文件 的 组 ID， 但 只 能 改 到 你 所 属 的 组 。 
如 果 这 些 函 数 由 非 超级 用 户 进程 调用 ， 则 在 成 功 返 回 时 ， 该 文件 的 设置 用 户 ID 位 和 设置 组 
ID 位 都 被 清除 。 


4.12 MAKE 


stat 结构 成 员 st_size 表示 以 字 节 为 单位 的 文件 的 长 度 。 此 字段 只 对 普通 文件 、 目 录 文 件 
和 符号 链接 有 意义 。 
FreeBSD 8.0, Mac OS X 10.6.8 和 Solaris 10 对 管道 也 定义 了 文件 长 度 ， 它 表示 可 从 该 管道 中 
读 到 的 字 节 数 ， 我 们 将 在 15.2 中 讨论 管道 。 


对 于 普通 文件 ， 其 文件 长 度 可 以 是 0,， 在 开始 读 这 种 文件 时 ,将 得 到 文件 结束 Cend-of-file) 指示 。 
对 于 目录 ， 文 件 长 度 通常 是 一 个 数 (如 16 或 512) 的 整 倍数 ， 我 们 将 在 422 节 中 说 明 读 目录 操作 。 

对 于 符号 链接 ， 文 件 长 度 是 在 文件 名 中 的 实际 字 节 数 。 例 如 ， 在 下 面 的 例子 中 ， 文 件 长 度 7 
就 是 路 径 名 usr/lib 的 长 度 : 

lrwxrwxrwx 1 root 7 Sep 25 07:14 lib -> usr/lib 
(注意 ， 因 为 符号 链接 文件 长 度 总 是 由 st size 指示 ， 所 以 它 并 不 包含 通常 C 语言 用 作 名 字 结 尾 
的 null 字 节 。) 

现今 ， 大 多 数 现代 的 UNIX 系统 提供 字段 st_blksize 和 st _ blocks。 其 中 ， 第 一 个 是 对 
文件 VO 较 合 适 的 块 长 度 ， 第 二 个 是 所 分 配 的 实际 512 字 节 块 块 数 。 回 忆 3.9 节 ， 其 中 提 到 了 当 
我 们 将 st blksize 用 于 读 操 作 时 ， 读 一 个 文件 所 需 的 时 间 量 最 少 。 为 了 提高 效率 ， 标 准 IO 库 
(我 们 将 在 第 5 章 中 说 明 ) 也 试图 一 次 读 、 写 st_ blksize 个 字 节 。 

应 当 了 解 的 是 ， 不 同 的 UNIX 版 本 其 st blocks 所 用 的 单位 可 能 不 是 512 字 节 的 块 。 使 用 
此 值 并 不 是 可 移植 的 。 


文件 中 的 空洞 
在 3.6 节 中 ， 我 们 提 及 普通 文件 可 以 包含 空洞 。 在 图 3-2 程序 中 例 示 了 这 一 点 。 空 洞 是 由 所 
设置 的 偏 移 量 超过 文件 尾 端 ， 并 写 入 了 某 些 数据 后 造成 的 。 作 为 一 个 例子 ， 考 虑 下 列 情况 : 


$ ls -1 core 
-rw-r--r-- 1 sar 8483248 Nov 18 12:18 core 
$ du -s core 





272 core 
文件 core 的 长 度 稍稍 超过 8MB， 可 是 du 命令 报告 该 文件 所 使 用 的 磁盘 空间 总 量 是 272 个 512 
字 节 块 〈 即 139264 字 节 )。 很 明显 ， 此 文件 中 有 很 多 空洞 。 
在 很 多 BSD KARL, du 命令 报告 的 是 1 024 字 节 块 的 块 数 ，Solaris 报告 的 是 512 字 节 块 的 
块 数 。 在 Linux 上 ， 报 告 的 块 数 单位 取决 于 是 否 设置 了 环境 变量 POSIXLY_CORRECT。 当 设置 了 
该 环境 变量 ，du 命令 报告 的 是 1024 字 节 块 的 块 数 ; 没有 设置 该 环境 变量 时 ，du 命令 报告 的 是 
512 字 节 块 的 块 数 。 


90 第 4 章 文件 和 目录 








正如 我 们 在 3.6 节 中 提 及 的 ， 对 于 没有 写 过 的 字 节 位 置 ，read 函数 读 到 的 字 节 是 0。 如 果 执 
行 下 面 的 命令 ， 可 以 看 出 正常 的 VO 操作 读 整个 文件 长 度 : 


$ wc -c core 
8483248 core 


带 -c 选项 的 wc(1) 命 令 计算 文件 中 的 字符 数 ( 字 节 )。 


如 果 使 用 实用 程序 (如 cat(1)) 复制 这 个 文件 ， 那 么 所 有 这 些 空洞 都 会 被 填 满 ， 其 中 所 有 实 
际 数据 字 节 皆 填 写 为 0。 

$ cat core > core.copy 

$ ls -1 core* 

—Ewer-e-er-- 1 sar 8483248 Nov 18 12:18 core 

-rw-rw-r-- 1 sar 8483248 Nov 18 12:27 core.copy 

$ du -s core* 

272 core 

16592  core.copy 


从 中 可 见 ， 新 文件 所 用 的 实际 字 节 数 是 8 495 104 (512x16 592)。 此 长 度 与 1s 命令 报告 的 长 度 不 
同 ， 其 原因 是 ， 文 件 系统 使 用 了 若干 块 以 存放 指向 实际 数据 块 的 各 个 指针 。 

有 兴趣 的 读者 可 以 参阅 Bach[1986] 的 4.2 节 、McKusick 等 [1996] 的 7.2 节 和 7.3 节 (ER McKusick 
和 Neville-Neil[2005] 的 8.2 节 和 8.3 节 )、McDougall 和 Mauro[2007] 的 15.2 节 以 及 Singh[2006] 的 
第 12 章 ， 以 更 详细 地 了 解 文件 的 物理 结构 。 


4.13 ”文件 截断 


有 时 我 们 需要 在 文件 尾 端 处 截 去 一 些 数 据 以 缩短 文件 。 将 一 个 文件 的 长 度 截断 为 0 是 一 个 特 
例 ， 在 打开 文件 时 使 用 O. TRUNC 标志 可 以 做 到 这 一 点 。 为 了 截断 文件 可 以 调用 函数 truncate 
和 ftruncate。 
#include <unistd.h> 


int 七 runcate (Const char *pathname, off 七 length); 


int ftruncate(int fd, off_t length); 





两 个 函数 的 返回 值 : 若 成 功 ， 返 回 0;， 若 出 错 ， 返 回 -1 
这 两 个 函数 将 一 个 现 有 文件 长 度 截 断 为 length。 如 果 该 文件 以 前 的 长 度 大 于 length, Wii 
length 以 外 的 数据 就 不 再 能 访问 。 如 果 以 前 的 长 度 小 于 Iength， 文 件 长 度 将 增加 ， 在 以 前 的 文件 
尾 端 和 新 的 文件 尾 端 之 间 的 数据 将 读 作 0〈 也 就 是 可 能 在 文件 中 创建 了 一 个 空洞 )。 
早 于 4.4BSD 的 BSD 系统 只 能 用 truncate 函数 截 短 一 个 文件 ， 不 能 用 它 扩展 一 个 文件 。 
Solaris 对 fcntl 函数 进行 了 扩展 ,增加 了 F FREESP, 它 允 许 释放 一 个 文件 中 的 任何 一 部 分 ， 
而 不 只 是 文件 尾 端 处 的 一 部 分 。 


图 13-6 的 程序 使 用 了 ftruncate 函数 ， 以 便 在 获得 对 一 个 文件 的 锁 后 ， 清 空 该 文件 。 


4.14 ”文件 系统 


为 了 说 明文 件 链接 的 概念 ， 先 要 介绍 UNIX 文件 系统 的 基本 结构 。 同 时 ， 了 解 i 节点 和 指向 
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i 节 点 的 目录 项 之 间 的 区 别 也 是 很 有 益 的 。 
目前 ， 正 在 使 用 的 UNIX 文件 系统 有 多 种 实现 。 例 如 ，Solaris 支持 多 种 不 同类 型 的 磁盘 文件 
系统 : 传统 的 基于 BSD 的 UNIX 文件 系统 〈 称 为 UFS)， 读 、 写 DOS 格式 软盘 的 文件 系统 CER 
为 PcFS)， 以 及 读 CD 的 文件 系统 KA ESFS)。 在 图 2-20 中 ， 我 们 已 经 看 到 了 不 同类 型 文件 
系统 的 一 个 区 别 。UFS 是 以 Berkeley 快速 文件 系统 为 基础 的 。 本 节 讨 论 该 文件 系统 。 
每 一 种 文件 系统 类 型 都 有 它 各 自 的 特征 ， 有 些 特征 可 能 是 混淆 不 清 的 。 例 如， 大 部 分 UNIX 
文件 系统 支持 大 小 写 敏感 的 文件 名 。 因 此 ， 如 果 创 建 了 一 个 名 为 file .txt 的 文件 以 及 另外 一 
个 名 为 file .TXT 的 文件 ， 就 是 创建 了 两 个 不 同 的 文件 。 在 Mac OS X E, HFS 文件 系统 是 大 
小 写 保留 的 ， 并 且 是 大 小 写 不 敏感 比较 的 。 因 此 ， 如 果 创建 了 一 个 名 为 file.txt 的 文件 ， 当 
你 再 创建 名 为 file .TXT 的 文件 时 ， 就 会 覆盖 原来 的 file.txt LH, 但 是 , 保存 在 文件 系统 
中 的 是 文件 创建 时 的 文件 名 (CEP fijle.txt， 因 为 是 大 小 写 保 留 的 ), 事实 上 , 在 “f, i, 1, 
e, ., t, x, t” 这 个 序列 中 的 大 写 或 小 写字 母 的 排列 都 会 在 搜索 这 个 文件 时 得 到 匹配 ( 大 小 
写 不 敏感 比较 .)。 因 此 ,除了 file.txt 和 file.TXT, 我 们 还 可 以 用 File.txt. fILE.tXt 
以 及 FiLe .TxT 等 名 字 来 访问 该 文件 。 


我 们 可 以 把 一 个 磁盘 分 成 一 个 或 多 个 分 区 。 每 个 分 区 可 以 包含 一 个 文件 系统 〈 见 图 4-13)。i 
节点 是 固定 长 度 的 记录 项 ， 它 包含 有 关 文件 的 大 部 分 信息 。 






































磁盘 分 区 | 分 区 | 分 区 
文件 系统 | 柱 面 组 0 | 柱 面 组 1 加 柱 面 组 n | 
自 举 块 E to 
iR <= 二 一 : 
超级 块 | 配置 | 节点 ue : F 
| 副本 | 信息 | 图 | 决 位 图 | DEA | 数据 块 | 
i 节点 ita i 节点 


图 4-13 磁盘 、 分 区 和 文件 系统 

如 果 更 仔细 地 观察 一 个 柱 面 组 的 i 节点 和 数据 块 部 分 ， 则 可 以 看 到 图 4-14 中 所 示 的 情况 。 

注意 图 4-14 中 的 下 列 各 点 。 

。 在 图 中 有 两 个 目录 项 指向 同一 个 i 节 点。 每 个 i 节点 中 都 有 一 个 链接 计数 ， 其 值 是 指向 该 
i 节 点 的 目录 项 数 。 只 有 当 链 接 计 数 减 少 至 0 时 ， 才 可 删除 该 文件 (也 就 是 可 以 释放 该 文 
件 占用 的 数据 块 )。 这 就 是 为 什么 “解除 对 一 个 文件 的 链接 ”操作 并 不 总 是 意味 着 “释放 
该 文件 占用 的 磁盘 块 ” 的 原因 。 这 也 是 为 什么 删除 一 个 目录 项 的 函数 被 称 之 为 unlink 
MA delete 的 原因 。 在 stat 结构 中 ， 链 接 计数 包含 在 st_nlink 成 员 中 ， 其 基本 
系统 数据 类 型 是 nlink t。 这 种 链接 类 型 称 为 硬 链接 。 回 忆 2.5.2 节 ， 其 中 ，POSIX.1 3$ 
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量 LINK MAX 指定 了 一 个 文件 链接 数 的 最 大 值 。 

















图 4-14 较 详 细 的 柱 面 组 的 i 节点 和 数据 块 
另外 一 种 链接 类 型 称 为 符号 链接 (symbolic link)。 符 号 链接 文件 的 实际 内 容 〈 在 数据 块 
TO 包含 了 该 符号 链接 所 指向 的 文件 的 名 字 。 在 下 面 的 例子 中 ， 目 录 项 中 的 文件 名 是 3 
个 字符 的 字符 串 1ib， 而 在 该 文件 中 包含 了 7 个 字 节 的 数据 usr/lib: 


lrwxrwxrwx 1 root 7 Sep 25 07:14 lib -> urs/lib 


该 i 节点 中 的 文件 类 型 是 s_IFLNK， 于 是 系统 知道 这 是 一 个 符号 链接 。 

i 节点 包含 了 文件 有 关 的 所 有 信息 : 文件 类 型 、 文 件 访问 权限 位 、 文 件 长 度 和 指向 文件 数 
据 块 的 指针 等 。stat 结构 中 的 大 多 数 信息 都 取 自 i 节点。 只 有 两 项 重要 数据 存放 在 目录 
项 中 : 文件 名 和 i 节点 编号 。 其 他 的 数据 项 (如 文件 名 长 度 和 目录 记录 长 度 ) 并 不 是 本 书 
关心 的 。i 节点 编号 的 数据 类 型 是 ino_t。 

因为 目录 项 中 的 i 节点 编号 指向 同一 文件 系统 中 的 相应 i 节点, 一 个 目录 项 不 能 指 问 男 一 
个 文件 系统 的 i 节点 。 这 就 是 为 什么 1n(1) 命 令 (构造 一 个 指向 一 个 现 有 文件 的 新 目录 项 ) 
不 能 跨越 文件 系统 的 原因 。 我 们 将 在 下 一 节 说 明 Link 函数 。 

当 在 不 更 换文 件 系统 的 情况 下 为 一 个 文件 重 命名 时 ， 该 文件 的 实际 内 容 并 未 移动 ， 只 需 
构造 一 个 指向 现 有 i 节点 的 新 目录 项 ， 并 删除 老 的 目录 项 。 链 接 计 数 不 会 改变 。 例如， 为 
将 文件 /usr/1ib/foo 重 命名 为 /usr/foo, 如 果 目 录 /usr/1ib 和 /usr 在 同一 文件 系 
统 中 ， 则 文件 foo 的 内 容 无 需 移动 。 这 就 是 mv(1) 命 令 的 通常 操作 方式 。 


我 们 说 明了 普通 文件 的 链接 计数 概念 ， 但 是 对 于 目录 文件 的 链接 计数 字段 又 如 何 呢 ? 假定 我 
们 在 工作 目录 中 构造 了 一 个 新 目录 : 

$ mkdir testdir 

图 4-15 显示 了 其 结果 。 注 意 ， 该 图 显 式 地 显示 了 .和 . .目录 项 。 

编号 为 2549 的 i 节点 ， 其 类 型 字段 表示 它 是 一 个 目录 ， 链 接 计 数 为 2。 任何 一 个 叶 目 录 〈 不 
包含 任何 其 他 目录 的 目录 ) 的 链接 计数 总 是 2， 数 值 2 来 自 于 命名 该 目录 (testdir) 的 目录 项 
以 及 在 该 目录 中 的 .项 。 编号 为 1267 的 i 节点 ， 其 类 型 字段 表示 它 是 一 个 目录 ， 链 接 计 数 大 于 或 
等 于 3。 它 大 于 或 等 于 3 的 原因 是 ,至少 有 3 个 目录 项 指向 它 : 一 个 是 命名 它 的 目录 项 (在 图 4-15 
中 没有 表示 出 来 ), 第 二 个 是 在 该 目录 中 的 .项 , 第 三 个 是 在 其 子 目 录 testdir 中 的 . .项 。 注 意 ， 
在 父 目录 中 的 每 一 个 子 目 录 都 使 该 父 目录 的 链接 计数 增加 1。 
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目录 块 和 数据 块 



















































图 4-15 创建 了 目录 testdir 后 的 文件 系统 实例 

这 种 格式 与 UNIX 文件 系统 的 经 典 格式 类 似 ， 在 Bach[1986] 的 第 4 章 中 对 此 进行 了 详细 说 明 。 关 于 

伯克利 快速 文件 系统 对 此 所 做 的 更 改 请 参阅 McKusick 等 [1996] 的 第 7 章 以 及 McKusick 和 

Neville-Neil[2005] 中 的 第 8 章 。 关 于 UFS( 伯 克利 快速 文件 系统 的 Solaris 版 ) 的 详细 情况 ,请 参见 McDougall 
和 Mauro[2007] 的 第 15 章 。 关 于 Mac OS X 使 用 的 HES 文件 系统 格式 ， 请 参阅 Singh[2006] 的 第 12 章 。 


4.15 AŽ link, linkat, unlink, unlinkat 和 remove 


如 上 节 所 述 ， 任 何 一 个 文件 可 以 有 多 个 目录 项 指向 其 i 节点 。 创 建 一 个 指向 现 有 文件 的 链接 
的 方法 是 使 用 Link 函数 或 1inkat MR. 
#include <unistd.h> 


int link(const char *existingpath, const char *newpath) ; 


int linkat (int efd, const char *existingpath, int nfd, const char *newpath, int flag); 


两 个 函数 的 返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 





这 两 个 函数 创建 一 个 新 目录 项 newpath， 它 引用 现 有 文件 existingpath. WR newpath 已 经 存 
在 ， 则 返回 出 错 。 只 创建 newpath 中 的 最 后 一 个 分 量 ， 路 径 中 的 其 他 部 分 应 当 已 经 存在 。 

对 于 1inkat 函数 ， 现 有 文件 是 通过 efd 和 existingpath 参数 指定 的 ， 新 的 路 径 名 是 通过 nfd 
和 newpath 参数 指定 的 。 默 认 情况 下 ， 如 果 两 个 路 径 名 中 的 任 一 个 是 相对 路 径 ， 那 么 它 需要 通过 
相对 于 对 应 的 文件 描述 符 进行 计算 。 如 果 两 个 文件 描述 符 中 的 任 一 个 设置 为 AT_FDCWD， 那 么 相 
应 的 路 径 名 (如 果 它 是 相对 路 径 ) 就 通过 相对 于 当前 目录 进行 计算 。 如 果 任 一 路 径 名 是 绝对 路 径 ， 
相应 的 文件 描述 符 参 数 就 会 被 忽略 。 

当 现 有 文件 是 符号 链接 时 ， 由 flag 参数 来 控制 1inkat 函数 是 创建 指向 现 有 符号 链接 的 链接 还 
是 创建 指向 现 有 符号 链接 所 指向 的 文件 的 链接 。 如 果 在 flag 参数 中 设置 了 AT_SYMLINK FOLLOW 标 
志 ， 就 创建 指向 符号 链接 目标 的 链接 。 如 果 这 个 标志 被 清除 了 ， 则 创建 一 个 指向 符号 链接 本 身 的 链接 。 

创建 新 目录 项 和 增加 链接 计数 应 当 是 一 个 原子 操作 (请 回忆 在 3.11 节 中 对 原子 操作 的 讨论 )。 
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虽然 POSIX.1 允许 实现 支持 跨越 文件 系统 的 链接 , 但 是 大 多 数 实现 要 求 现 有 的 和 新 建 的 两 个 
路 径 名 在 同一 个 文件 系统 中 。 如 果实 现 支 持 创 建 指向 一 个 目录 的 硬 链接 ， 那 么 也 仅 限 于 超级 用 户 
才 可 以 这 样 做 。 其 理由 是 这 样 做 可 能 在 文件 系统 中 形成 循环 ， 大 多 数 处 理 文件 系统 的 实用 程序 都 
不 能 处 理 这 种 情况 (4.17 节 将 说 明 一 个 由 符号 链接 引入 循环 的 例子 )。 因 此 ， 很 多 文件 系统 实现 
不 允许 对 于 目录 的 硬 链 接 。 

为 了 删除 一 个 现 有 的 目录 项 ， 可 以 调用 unlink 函数 。 
#include <unistd.h> 


int unlink(const char *pathname) ; 


int unlinkat(int fd, const char *pathname, int flag); 
p 


两 个 函数 的 返回 值 : 若 成 功 ， 返 回 0;， 若 出 错 ， 返 回 -1 





这 两 个 函数 删除 目录 项 ， 并 将 由 pathname 所 引用 文件 的 链接 计数 减 1。 如 果 对 该 文件 还 有 其 
他 链接 ， 则 仍 可 通过 其 他 链接 访问 该 文件 的 数据 。 如 果 出 错 ， 则 不 对 该 文件 做 任何 更 改 。 

我 们 在 前 面 已 经 提 及 ， 为 了 解除 对 文件 的 链接 ， 必 须 对 包含 该 目录 项 的 目录 具有 写 和 执行 权限 。 正 
如 4.10 ADA, 如果 对 该 目录 设置 了 粘着 位 ， 则 对 该 目录 必须 具有 写 权 限 , 并 且 具 备 下 面 三 个 条 件 之 一 : 

© 拥有 该 文件 ; 

。 拥有 该 目录 ; 

。 具有 超级 用 户 权 限 。 

只 有 当 链 接 计 数 达到 0 时 ， 该 文件 的 内 容 才 可 被 删除 。 另 一 个 条 件 也 会 阻止 删除 文件 的 内 
容 一 一 只 要 有 进程 打开 了 该 文件 ， 其 内 容 也 不 能 删除 。 关 闭 一 个 文件 时 ， 内 核 首 先 检查 打开 该 
文件 的 进程 个 数 ， 如 果 这 个 计数 达到 0， 内 核 再 去 检查 其 链接 计数 ; 如 果 计 数 也 是 0， 那 么 就 删 
除 该 文件 的 内 容 。 

如 果 pathname 参数 是 相对 路 径 名 ， 那 么 unlinkat 函数 计算 相对 于 由 应 文件 描述 符 参 数 代 
表 的 目录 的 路 径 名 。 如 果 入 参数 设置 为 AT_FDCWD， 那 么 通过 相对 于 调用 进程 的 当前 工作 目录 来 
计算 路 径 名 。 如 果 pathname 参数 是 绝对 路 径 名 ， 那 么 fd 参数 被 忽略 。 

flag 参数 给 出 了 一 种 方法 ,使 调用 进程 可 以 改变 unlinkat 函数 的 默认 行为 。 当 RAT_REMOVEDIR 

[7] 标志 被 设置 时 ，unlinkat 函数 可 以 类 似 于 rmdir 一 样 删除 目录 。 如 果 这 个 标志 被 清除 ， 

unlinkat 5 unlink 执行 同样 的 操作 。 





下 实例 
图 4-16 的 程序 打开 一 个 文件 ， 然 后 解除 它 的 链接 。 执 行 该 程序 的 进程 然后 睡眠 15 秒 ， 接 者 
就 终止 。 


#include "apue.h" 
#include <fcntl.h> 


int 
main (void) 
{ 
if (open("tempfile", O_RDWR) < 0) 
err_sys("open error"); 
if (unlink("tempfile") < 0) 
err_sys("unlink error"); 
printf("file unlinked\n"); 
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sleep(15); 
printf ("done\n") ; 
exit (0); 


图 4-16 ”打开 一 个 文件 ， 然 后 unlink 它 
运行 该 程序 ， 其 结果 是 : 


$ ls -l tempfile 查看 文件 大 小 
—PDWereeeee 1 sar 413265408 Jan 21 07:14 tempfile 
$ df /home 检查 可 用 磁盘 空间 
Filesystem 1K-blocks Used Available Use% Mounted on 
/dev/hda4 11021440 1956332 9065108 18% /home 
$ ./a.out & 在 后 台 运 行 图 4-16 程序 
1364 shell 打印 其 进程 ID 
$ file unlinked 解除 文件 链接 
ls -1 tempfile 观察 文件 是 否 仍 然 存 在 
ls: tempfile: No such file or directory 目录 项 已 删除 
$ df /home 检查 可 用 磁盘 空间 有 无 变化 
Filesystem 1K-blocks Used Available Use% Mounted on 
/ dev/hda4 11021440 1956332 9065108 18% /home 
$ done 程序 执行 结束 ， 关 闭 所 有 打开 文件 
df /home 现在 ， 应 当 有 更 多 可 用 磁盘 空间 
Filesystem 1K-blocks Used Available Use% Mounted on 
/dev/hda4 11021440 1552352 9469088 15% /home 

BLE, 394.1 MB 磁盘 空间 可 用 m 


unlink FIX PURVES TÉ BORE FP FAR A DB EE TE FRF TR, EAE NC HE B AN 8E 
留 下 来 。 进 程 用 open 或 creat 创建 一 个 文件 ， 然 后 立即 调用 unlink， 因 为 该 文件 仍旧 是 打开 
的 ， 所 以 不 会 将 其 内 容 删除 。 只 有 当 进 程 关 闭 该 文件 或 终止 时 (在 这 种 情况 下 ， 内 核 关 闭 该 进程 
所 打开 的 全 部 文件 )， 该 文件 的 内 容 才 被 删除 。 

如 果 pathname 是 符号 链接 , ABA unlink 删除 该 符号 链接 , 而 不 是 删除 由 该 链接 所 引用 的 文件 。 
给 出 符号 链接 名 的 情况 下 ， 没 有 一 个 函数 能 删除 由 该 链接 所 引用 的 文件 。 

如 果 文 件 系统 支持 的 话 ， 超 级 用 户 可 以 调用 unlink, HB pathname 指定 一 个 目录 ， 
但 是 通常 应 当 使 用 rmdir 函数 , 而 不 使 用 unlink 这 种 方式 。 我 们 将 在 4.21 节 中 说 明 rmdir 
函数 。 

我 们 也 可 以 用 remove 函数 解除 对 一 个 文件 或 目录 的 链接 。 对 于 文件 ，remove 的 功能 与 
unlink 相同 。 对 于 目录 ，remove 的 功能 与 rmdir 相同 。 


#include <stdio.h> 


int remove(const char *pathname) ; 





返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 
ISO C 指定 remove 函数 删除 一 个 文件 ,这 更 改 了 UNIX 历来 使 用 的 名 字 unlink, 其 原因 是 实 
3L C 标准 的 大 多 数 非 UNIX 系统 并 不 支持 文件 链接 。 


4.16 PR rename 和 renameat 


文件 或 目录 可 以 用 rename 函数 或 者 renameat 函数 进行 重 命名 。 
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#include <stdio.h> 


int rename(const char *oldname, const char *newname) ; 





int renameat (int oldfd, const char *oldname, int newfd, const char *newname) ; 

两 个 函数 的 返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 
ISO C 对 文件 定义 了 rename HK (C 标准 不 处 理 目录 )。POSIX.1 扩展 此 定义 ， 使 其 包含 了 

目录 和 符号 链接 。 


根据 oldname 是 指 文 件 、 目 录 还 是 符号 链接 ， 有 几 种 情况 需要 加 以 说 明 。 我 们 也 必须 说 明 如 
果 newname 已 经 存在 时 将 会 发 生 什么 。 

(1) 如 果 oldname 指 的 是 一 个 文件 而 不 是 目录 ， 那 么 为 该 文件 或 符号 链接 重 命名 。 在 这 种 情 
况 下 ， 如 果 newname 已 存在 ， 则 它 不 能 引用 一 个 目录 。 如 果 newname 已 存在 ， 而 且 不 是 一 个 目 
录 ， 则 先 将 该 目录 项 删除 然后 将 oldname 重 命 名 为 newname。 对 包含 oldname 的 目录 以 及 包含 
newname 的 目录 ， 调 用 进程 必须 具有 写 权 限 ， 因 为 将 更 改 这 两 个 目录 。 

(2) 如 若 oldname 指 的 是 一 个 目录 ， 那 么 为 该 目录 重 命名 。 如 果 newname 已 存在 ， 则 它 必须 
引用 一 个 目录 ， 而 且 该 目录 应 当 是 空 目 录 ( 空 目录 指 的 是 该 目录 中 只 有 .和 . .项 )。 如 果 newname 
存在 〈 而 且 是 一 个 空 目 录 )， 则 先 将 其 删除 ， 然 后 将 oldname 重 命 名 为 newname。 男 外 ， 当 为 一 
个 目录 重 命名 时 ，newname 不 能 包含 oldname 作为 其 路 径 前 级 。 例 如 ， 不 能 将 /usr/foo 重 命名 

为 /usr/foo/testdir， 因 为 旧名 字 (/usr/foo) 是 新 名 字 的 路 径 前 经， 因而 不 能 将 其 删除 。 

(3) 如 车 oldname 或 newname 引用 符号 链接 ， 则 处 理 的 是 符号 链接 本 身 ， 而 不 是 它 所 引用 的 
文件 。 

(4) 不 能 对 .和 . . 重 命名 。 更 确切 地 说 ，. 和 . .都 不 能 出 现在 oldname 和 newname 的 最 后 部 分 。 

(5) 作为 一 个 特例 ， 如 果 oldname 和 newname 引用 同一 文件 ， 则 函数 不 做 任何 更 改 而 成 功 返 回 。 

如 若 newname 已 经 存在 ， 则 调用 进程 对 它 需 要 有 写 权 限 〈 如 同 删除 情况 一 样 )。 另 外 ， 调 用 
进程 将 删除 oldname 目录 项 ， 并 可 能 要 创建 newname 目录 项 ， 所 以 它 需 要 对 包含 oldname 及 包含 
newname 的 目录 具有 写 和 执行 权限 。 

除了 当 oldname 或 newname 指向 相对 路 径 名 时 ， 其 他 情况 下 renameat 函数 与 rename Ff 
数 功 能 相同 。 如 果 oldname 参数 指定 了 相对 路 径 , 就 相对 于 oldfa 参数 引用 的 目录 来 计算 oldname. 
类 似 地 ， 如 果 newname 指定 了 相对 路 径 ， 就 相对 于 newfd 引用 的 目录 来 计算 newname. oldfd 或 
newfd 参数 (或 两 者 ) 都 能 设置 成 AT_FDCWD， 此 时 相对 于 当前 目录 来 计算 相应 的 路 径 名 。 


4.17 ”符号 链接 


符号 链接 是 对 一 个 文件 的 间接 指针 ， 它 与 上 一 节 所 述 的 硬 链接 有 所 不 同 ， 硬 链接 直接 指向 文 
件 的 i 节点。 引入 符号 链接 的 原因 是 为 了 避 开 硬 链接 的 一 些 限 制 。 

。 便 链接 通常 要 求 链接 和 文件 位 于 同一 文件 系统 中 。 

。 只 有 超级 用 户 才能 创建 指向 目录 的 硬 链 接 (在 底层 文件 系统 支持 的 情况 下 )。 

对 符号 链接 以 及 它 指向 何 种 对 象 并 无 任何 文件 系统 限制 ， 任 何 用 户 都 可 以 创建 指向 目录 的 符 
号 链接 。 符 号 链接 一 般 用 于 将 一 个 文件 或 整个 目录 结构 移 到 系统 中 男 一 个 位 置 。 

当 使 用 以 名 字 引 用 文件 的 函数 时 ， 应 当 了 解 该 函数 是 否 处 理 符号 链接 。 也 就 是 该 函数 是 否 跟 
随 符号 链接 到 达 它 所 链接 的 文件 。 如 若 该 函数 具有 处 理 符 号 链接 的 功能 ， 则 其 路 径 名 参数 引用 由 
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符号 链接 指向 的 文件 。 否则 , 一 个 路 径 名 参数 引用 链接 本 身 , 而 不 是 由 该 链接 指向 的 文件 。 图 4-17 

列 出 了 本 章 中 所 说 明 的 各 个 函数 是 否 处 理 符号 链接 。 在 图 4-17 中 没有 列 出 mkdir、mkinfo、 
mknod 和 rmdir 这 些 函数 ， 其 原因 是 ， 当 路 径 名 是 符号 链接 时 ， 它 们 都 出 错 返回 。 以 文件 描述 

符 作为 参数 的 一 些 函 数 (如 £stat. fchmod 等 ) 也 未 在 该 图 中 列 出 ， 其 原因 是 ， 对 符号 链接 的 

处 理 是 由 返回 文件 描述 符 的 函数 (通常 是 open) 进行 的 。chown 是 否 跟 随 符号 链接 取决 于 实现 。 
在 所 有 现代 的 系统 中 ，chown 函数 都 跟随 符号 链接 。 


符号 链接 由 4.2BSD 引入 ，chown 最 初 并 不 跟随 符号 链接 ,但 在 4.4BSD 中 情况 发 生 了 变化 。 
SVR4 中 的 System V 包含 了 对 符号 链接 的 支持 ， 但 与 原始 BSD 中 的 行为 已 大 不 相同 ， 也 实现 了 
chown 函数 跟随 符号 链接 。 早 期 Linux 版 本 中 ( Linux 2.1.81 以 前 的 版 本 )，chown 并 不 跟随 符号 
链接 。 从 2.1.81 版 开始 ，chown 跟随 符号 链接 。FreeBSD 8.0, Mac OS X 10.6.8 和 Solaris 10 中 ， 
chown 跟随 符号 链接 。 所 有 这 些 平台 都 实现 了 Lchown， 它 改变 符号 链接 自身 的 所 有 权 。 


不 跟随 符号 链接 | 跟随 符号 链接 





access 
chdir 
chmod 
chown 
creat 
exec 
lchown 
link 
lstat 
open 
opendir 
pathconf 
readlink 
remove 
rename 
stat 
truncate 
unlink 


图 4-17 各 个 函数 对 符号 链接 的 处 理 
图 4-17 的 一 个 例外 是 ， 同 时 用 O_CREAT 和 o EXCL 两 者 调用 open 函数 。 在 此 情况 下 ， 若 
路 径 名 引用 符号 链接 ，open 将 出 错 返 回 ，errno 设置 为 EEXIST。 这 种 处 理 方式 的 意图 是 堵塞 
一 个 安全 性 漏洞 ， 以 防止 具有 特权 的 进程 被 诱骗 写 错误 的 文件 。 


看 实例 
使 用 符号 链接 可 能 在 文件 系统 中 引入 循环 。 大 多 数 查 找 路 径 名 的 函数 在 这 种 情况 发 生 时 都 将 
出 错 返 回 ，errno 值 为 ELOOP。 考 虑 下 列 命令 序列 : 


$ mkdir foo 创建 一 个 新 目录 

$ touch foo/a 创建 一 个 0 长 度 的 文件 

$ ln -s ../foo foo/testdir 创建 一 个 符号 链接 

$ 1s -1 foo 

total 0 

EWSP SSH 1 sar 0 Jan 22 00:16 a 

lrwxrwxrwx 1 sar 6 Jan 22 00:16 testdir -> ../foo 
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这 创建 了 一 个 目录 foo， 它 包含 了 一 个 名 为 a 的 文件 以 及 一 个 指向 foo 的 符号 链接 。 在 图 4-18 

中 显示 了 这 种 结果 ， 图 中 以 圆 表示 目录 ， 以 正方 形 表 示 y 

一 个 文件 。 [ ne Nae 
如 果 我 们 写 一 段 简单 的 程序 ， 使 用 Solaris 的 标准 函 * 

数 ftw(3) 以 降序 遍历 文件 结构 , 打印 每 个 遇 到 的 路 径 名 ， " 

则 其 输出 是 : m 
foo A. 
foo/a 4-18 构成 循环 的 符号 链接 testdir 


foo/testdir 

foo/testdir/a 
foo/testdir/testdir 
foo/testdir/testdir/a 
foo/testdir/testdir/testdir 
foo/testdir/testdir/testdir/a 


(更 多 行 ， 直 至 ftw 出 错 返 回 ， 此 时 ，errno 值 为 ELOOP) 
422 节 提 供 了 我 们 自己 的 ftw 函数 版 本 ， 它 用 1stat 代替 stat 以 阻止 它 跟随 符号 链接 。 


注意 ，Linux 的 ftw 和 nftw 函数 记录 了 所 有 看 到 的 目录 并 训 免 多 次 重复 处 理 一 个 目录 ， 因 
此 这 两 个 函数 不 显示 这 种 程序 运行 行为 。 


这 样 一 个 循环 是 很 容易 消除 的 。 因 为 unlink 并 不 跟随 符号 链接 ， 所 以 可 以 unlink 文件 
foo/testdir。 但 是 如 果 创 建 了 一 个 构成 这 种 循环 的 硬 链接 ， 那 么 就 很 难 消除 它 。 这 就 是 为 什 
么 Link 函数 不 允许 构造 指向 目录 的 硬 链接 的 原因 (除非 进程 具有 超级 用 户 权限 )。 


实际 上 ，Rich Stevens 在 写本 节 的 最 初版 本 时 ， 在 自己 的 系统 上 做 了 一 个 这 样 的 实验 。 结 果 文 
件 系统 变 得 错误 百出 。 正 常 的 fsck(1) 实 用 程序 不 能 修复 问题 。 为 了 修复 文件 系统 ， 不 得 不 使 用 
了 并 不 推荐 使 用 的 工具 clri(8) 和 dcheck(8)。 

对 目录 的 硬 链 接 的 需求 由 来 已 久 , 但 是 使 用 符号 链接 和 mkdir 函数 ,用 户 就 不 再 需要 创建 指 
向 目录 的 硬 链接 了 。 


用 open 打开 文件 时 ， 如 果 传 递 给 open 函数 的 路 径 名 指定 了 一 个 符号 链接 ， 那 么 open 跟 


随 此 链接 到 达 所 指定 的 文件 。 若 此 符号 链接 所 指向 的 文件 并 不 存在 ， 则 open 返回 出 错 ， 表 示 它 
不 能 打开 该 文件 。 这 可 能 会 使 不 熟悉 符号 链接 的 用 户 感到 迷惑 ， 例 如 : 


$ 1n -s /no/such/file myfile 创建 一 个 符号 链接 

$ ls myfile 

myfile ls 查 到 该 文件 

$ cat myfile 试图 查看 该 文件 

cat: myfile: No such file or directory 

$ ls -1 myfile 尝试 -1 选项 

lrwxrwxrwx 1 sar 13 Jan 22 00:26 myfile -> /no/such/file 


文件 myfile 存在 ， 但 cat 却 称 没有 这 一 文件 。 其 原因 是 myfile 是 个 符号 链接 ， 由 该 符 
号 链接 所 指向 的 文件 并 不 存在 。1s 命令 的 -1 选项 给 我 们 两 个 提示 : 第 一 个 字符 是 1， 它 表示 这 
是 一 个 符号 链接 ， 而 -> 也 表明 这 是 一 个 符号 链接 。1s 命令 还 有 另 一 个 选项 -FE， 它 会 在 符号 链接 
的 文件 名 后 加 一 个 @ 符 号 ， 在 未 使 用 -1 选项 时 ， 这 可 以 帮助 我 们 识别 出 符号 链接 。 " 
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4.18 ”创建 和 读 取 符号 链接 


可 以 用 symlink 或 symlinkat 函数 创建 一 个 符号 链接 。 


#include <unistd.h> 


int symlink(const char *actualpath, const char *sympath) ; 


int symlinkat (const char *actualpath, int fd, const char *sympath) ; 
两 个 函数 的 返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 

函数 创建 了 一 个 指向 actualpath 的 新 目录 项 sympath。 在 创建 此 符号 链接 时 ， 并 不 要 求 actualpath 
已 经 存在 (在 上 一 节 结 束 部 分 的 例子 中 我 们 已 经 看 到 了 这 一 点 )。 并 且 ，actualpath 和 sympath 并 
不 需要 位 于 同一 文件 系统 中 。 

symlinkat MAS symlink 函数 类 似 , 但 sympath 参数 根据 相对 于 打开 文件 描述 符 引 用 的 
目录 CH fd 参数 指定 ) 进行 计算 。 如 果 sympath 参数 指定 的 是 绝对 路 径 或 者 fd 参数 设置 了 
AT FDCWD fü. JKA symlinkat 就 等 同 于 symlink AR. 

因为 open 函数 跟随 符号 链接 , 所 以 需要 有 一 种 方法 打开 该 链接 本 身 , 并 读 该 链接 中 的 名 字 。 
readlink 和 readlinkat 函数 提供 了 这 种 功能 。 


#include <unistd.h> 





ssize_t readlink(const char *restrict pathname, char *restrict buf, 
size t bufsize); 


ssize t readlinkat(int fd, const char* restrict pathname, 
char *restrict buf, size t bufsize); 


两 个 函数 的 返回 值 : 若 成 功 ， 返 回 读 取 的 字 节 数 ， 若 出 错 ， 返 回 -1 | | 123 





两 个 函数 组 合 了 open. read 和 close 的 所 有 操作 。 如 果 函 数 成 功 执行 ， 则 返回 读 入 buf 
的 字 节 数 。 在 buf 中 返回 的 符号 链接 的 内 容 不 以 null 字 节 终止 。 

当 pathname 参数 指定 的 是 绝对 路 径 名 或 者 应 参 数 的 值 为 AT_FDCWD，readlinkat 函数 的 
行为 与 readlink 相同 。 但 是 ， 如 果 . 刀 参数 是 一 个 打开 目录 的 有 效 文件 描述 符 并 且 pathname 参 
数 是 相对 路 径 名 ， 则 readlinkat 计算 相对 于 由 大 代表 的 打开 目录 的 路 径 名 。 


4.19 ”文件 的 时 间 


1E 42 节 中 , 我 们 讨论 了 Single UNIX Specification 2008 年 版 如 何 提 高 stat 结构 中 时 间 字 段 
的 精度 ,从 原来 的 秒 提高 到 秒 加 上 纳 秒 。 每 个 文件 属性 所 保存 的 实际 精度 依赖 于 文件 系统 的 实现 。 
对 于 把 时 间 惟 记录 在 秒 级 的 文件 系统 来 说 ， 纳 秒 这 个 字段 就 会 被 填充 为 0。 对 于 时 间 戳 的 记录 精 
度 高 于 秒 级 的 文件 系统 来 说 ， 不 足 秒 的 值 被 转换 成 纳 秒 并 记录 在 纳 秒 这 个 字段 中 。 

对 每 个 文件 维护 3 个 时 间 字 段 ， 它 们 的 意义 示 于 图 4-19 中 。 


Lm o | r mm 


文件 数据 的 最 后 访问 时 间 read 
文件 数据 的 最 后 修改 时 间 write it 
i 节点 状态 的 最 后 更 改 时 间 chmod、chown 








st_atim 














st mtim 





st ctim 


图 4-19 与 每 个 文件 相关 的 3 个 时 间 值 
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注意 ， 修 改 时 间 〈st_mtim) 和 状态 更 改 时 间 Cst_ctim) 之 间 的 区 别 。 修 改 时间 是 文件 内 容 
最 后 一 次 被 修改 的 时 间 。 状 态 更 改 时 间 是 该 文件 的 i 节点 最 后 一 次 被 修改 的 时 间 。 在 本 章 中 我 们 已 
说 明了 很 多 影响 到 i 节点 的 操作 ， 如 更 改 文件 的 访问 权限 、 更 改 用 户 ID、 更 改 链接 数 等 ， 但 它们 并 
没有 更 改 文件 的 实际 内 容 。 因 为 i 节点 中 的 所 有 信息 都 是 与 文件 的 实际 内 容 分 开 存放 的 ， 所 以 ， 除 
了 要 记录 文件 数据 修改 时 间 以 外 ， 还 需要 记录 状态 更 改 时 间 ， 也 就 是 更 改 i 节点 中 信息 的 时 间 。 

注意 ， 系 统 并 不 维护 对 一 个 i 节点 的 最 后 一 次 访问 时 间 ， 所 以 access 和 stat 函数 并 不 更 
改 这 3 个 时 间 中 的 任 一 个 。 

系统 管理 员 常 常 使 用 访问 时 间 来 删除 在 一 定时 间 范 围 内 没有 被 访问 过 的 文件 。 典 型 的 例子 是 删除 在 
过 去 一 周 内 没有 被 访问 过 的 名 为 a.out 或 core 的 文件 。find(1) 命 令 常 被 用 来 进行 这 种 类 型 的 操作 。 

124 修改 时 间 和 状态 更 改 时 间 可 被 用 来 归档 那些 内 容 已 经 被 修改 或 i 节点 已 经 被 更 改 的 文件 。 

ls 命令 按 这 3 个 时 间 值 中 的 一 个 排序 进行 显示 。 系 统 默 认 〈 用 -1 或 -t 选项 调用 时 ) 是 按 文件 的 
修改 时 间 的 先后 排序 显示 。-u 选项 使 1s 命令 按 访问 时 间 排 序 ，-c 选项 则 使 其 按 状态 更 改 时 间 排 序 。 

图 4-20 列 出 了 我 们 已 说 明 过 的 各 种 函数 对 这 3 个 时 间 的 作用 。 回 忆 4.14 节 中 所 述 ， 目 录 是 
包含 目录 项 (文件 名 和 相关 的 i 节点 编号 〉 的 文件 ， 增 加 、 删 除 或 修改 目录 项 会 影响 到 它 所 在 目 
录 相 关 的 3 个 时 间 。 这 就 是 在 图 4-20 中 包含 两 列 的 原因 ， 其 中 一 列 是 与 该 文件 (或 目录 ) 相关 的 
3 个 时 间 ， 另 一 列 是 与 所 引用 的 文件 〈 或 目录 ) 的 父 目 录 相 关 的 3 个 时 间 。 例 如 ， 创 建 一 个 新 文 
件 影响 到 包含 此 新 文件 的 目录 ， 也 影响 该 新 文件 的 i 节点 。 但 是 ， 读 或 写 一 个 文件 只 影响 该 文件 
的 i 节点， 而 对 目录 则 无 影响 。 


所 引用 文件 或 目录 


引用 的 文件 或 目录 的 父 目录 


chmod. fchmod 
chown, fchown 
creat . : O CREAT 新 文件 
creat : O TRUNC 现 有 文件 
exec . 

lchown 3 
link : 第 二 个 参数 的 父 目 录 
mkdir . 

mkfifo 


open . ; O_CREAT 新 文件 
open s O TRUNC 现 有 文件 


pipe 
read . ; 
remove . 删除 文件 = unlink 
remove . 删除 目录 = rmdir 
rename à 对 于 两 个 参数 


rmdir 











truncate. ftruncate 
unlink 

utimes. utimensat. 
futimens 

write 





图 4-20 各 种 函数 对 访问 、 修 改 和 状态 更 改 时 间 的 作用 
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(mkdir All rmdir 函数 将 在 4.21 节 中 说 明 。utimes、utimensat、futimens 图 数 将 在 
下 一 节 中 说 明 。7 个 exec 函数 将 在 8.10 节 中 讨论 。 第 15 章 将 说 明 mkfifo fl pipe MM.) 


4.20 AŽ futimens, utimensat 和 utimes 


一 个 文件 的 访问 和 修改 时 间 可 以 用 以 下 几 个 函数 更 改 。futimens 和 utimensat 函数 可 以 指 
定 纳 秒 级 精度 的 时 间 惟 。 用 到 的 数据 结构 是 与 stat 函数 族 相同 的 timespec 结构 (IL 42 节 )。 
#include «sys/stat.h» 
int futimens(int fd, const struct timespec fimes[2]); 
int utimensat (int fd, const char *path, const struct timespec fimes[2], int flag); 
两 个 函数 返回 值 ; 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 

这 两 个 函数 的 times 数组 参数 的 第 一 个 元 素 包 含 访问 时 间 ， 第 二 元 素 包含 修改 时 间 。 这 两 个 
时 间 值 是 日 历时 间 ， 如 1.10 节 所 述 ， 这 是 自 特定 时 间 (1970 年 1 月 1 日 00:00:00) 以 来 所 经 过 的 
秒 数 。 不 足 秒 的 部 分 用 纳 秒表 示 。 

时 间 戳 可 以 按 下 列 4 种 方式 之 一 进行 指定 。 

C1) 如 果 times 参数 是 一 个 空 指针 ， 则 访问 时 间 和 修改 时 间 两 者 都 设置 为 当前 时 间 。 

(2) 如 果 times 参数 指向 两 个 timespec 结构 的 数组 ， 任 一 数组 元 素 的 tv_nsec 字段 的 值 
为 UTIME_NOW， 相 应 的 时 间 戳 就 设置 为 当前 时 间 ， 忽 略 相 应 的 tv sec 字段 。 

(3) 如 果 times 参数 指向 两 个 timespec 结构 的 数组 ， 任 一 数组 元 素 的 tv_nsec 字段 的 值 
JJ UTIME_OMIT， 相 应 的 时 间 戳 保持 不 变 ， 忽 略 相 应 的 tv_sec FR. 

(4) 如 果 times 参数 指向 两 个 timespec 结构 的 数组 ， 且 tv_nsec 字段 的 值 为 既 不 是 
UTIME NOW 也 不 是 UTIME_OMIT， 在 这 种 情况 下 ， 相 应 的 时 间 戳 设置 为 相应 的 tv sec 和 
tv_nsec 字段 的 值 。 

执行 这 些 函 数 所 要 求 的 优先 权 取 决 于 times 参数 的 值 。 

e 如 果 times 是 一 个 空 指针 , 或 者 任 一 tv_nsec 字段 设 为 UTIME_NOW, 则 进程 的 有 效用 户 ID 

必须 等 于 该 文件 的 所 有 者 ID; 进程 对 该 文件 必须 具有 写 权限 , 或 者 进程 是 一 个 超级 用 户 进程 。 

e WẸ times 是 非 空 指针 ， 并 且 任 一 tv nsec 字段 的 值 既 不 是 UTIME NOW 也 不 是 

UTIME_OMIT， 则 进程 的 有 效用 户 ID 必须 等 于 该 文件 的 所 有 者 D, 或 者 进程 必须 是 一 个 








超级 用 户 进程 。 对 文件 只 具有 写 权 限 是 不 够 的 。 
e。 WẸ times 是 非 空 指针 ， 并 且 两 个 tv. nsee 字段 的 值 都 为 UTIME_OMIT， 就 不 执行 任何 的 
权限 检查 。 


futimens 函数 需要 打开 文件 来 更 改 它 的 时 间 ，utimensat 函数 提供 了 一 种 使 用 文件 名 更 
改 文件 时 间 的 方法 。pathname 参数 是 相对 于 fd 参数 进行 计算 的 , f4 要 么 是 打开 目录 的 文件 描述 
符 ， 要 么 设置 为 特殊 值 AT_FDCWD〔 强 制 通过 相对 于 调用 进程 的 当前 目录 计算 pathname). Un 
pathname 指定 了 绝对 路 径 ， 那 么 fd 参数 被 忽略 。 

utimensat 的 flag 参数 可 用 于 进一步 修改 默认 行为 。 如 果 设 置 了 AT SYMLINK NOFOLLOW 
标志 ， 则 符号 链接 本 身 的 时 间 就 会 被 修改 〈 如 果 路 径 名 指向 符号 链接 )。 默 认 的 行为 是 跟随 符号 
链接 ， 并 把 文件 的 时 间 改 成 符号 链接 的 时 间 。 

futimens 和 utimensat 函数 都 包含 在 POSIX.1 中 ， 第 3 个 函数 utimes 包含 在 Single 


102 第 4 章 文件 和 目录 





UNIX Specification 的 XSI 扩展 选项 中 。 


#include <sys/time.h> 


int utimes (const char *pathname, const struct timeval fimes[2]); 
函数 返回 值 ， 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 
utimes 函数 对 路 径 名 进行 操作 。times 参数 是 指向 包含 两 个 时 间 惟 《访问 时 间 和 修改 时 间 ) 
元 素 的 数组 的 指针 ， 两 个 时 间 惟 是 用 秒 和 微妙 表示 的 。 


struct timeval { 





time_t tv_sec; /* seconds */ 
long tv_usec; /* microseconds */ 


) 

注意 ， 我 们 不 能 对 状态 更 改 时 间 st ctim G 节点 最 近 被 修改 的 时 间 ) 指定 一 个 值 ， 因 为 调 
用 utimes 函数 时 ， 此 字段 会 被 自动 更 新 。 

在 某 些 UNIX 版 本 中 ,touch(l) 命 令 使 用 这 些 函 数 中 的 某 一 个 。 另 外 , 标准 归档 程序 tar(1) 
和 cpio(1) 可 选 地 调用 这 些 函 数 ， 以 便 将 一 个 文件 的 时 间 值 设置 为 将 它 归 档 时 保存 的 时 间 。 


PES 


图 4-21 的 程序 使 用 带 o TRUNC 选项 的 open 函数 将 文件 长 度 截断 为 0， 但 并 不 更 改 其 访问 
时 间 及 修改 时 间 。 为 了 做 到 这 一 点 ， 首 先 用 stat 函数 得 到 这 些 时 间 ， 然 后 截断 文件 ， 最 后 再 用 
futimens 函数 重 置 这 两 个 时 间 。 


#include "apue.h" 
#include <fcntl.h> 


int 
main(int argc, char *argv[]) 
{ 
int X, fü; 
struct stat statbuf; 
struct timespec times[2]; 
for (i = iy i € arger it*) ( 
if (stat(argv[i], &statbuf) « 0) ( /* fetch current times */ 
err ret("$s: stat error", argv[i]); 
continue; 
) 
if ((fd = open(argv[i], O RDWR | O TRUNC)) < 0) ( /* truncate */ 
err ret("$s: open error", argv[i]); 
continue; 
) 
times [0] statbuf.st atim; 
times[1] statbuf.st mtim; 
if (futimens(fd, times) < 0) /* reset times */ 
err ret("$s: futimens error", argv[i]); 
close(fd); 
} 
exit 0); 





图 4-21 futimens 函数 实例 


4.21 图 数 mkdir、mkqdirat 和 rmqdair ，103 


可 以 用 以 下 Linux 命令 演示 图 4-21 中 的 程序 : 


$ ls -l changemod times 查看 长 度 和 最 后 修改 时 间 
-rwxr-xr-x 1 sar 13792 Jan 22 01:26 changemod 
-rwxr-xr-x 1 sar 13824 Jan 22 01:26 times 

$ ls -lu changemod times 查看 最 后 访问 时 间 
-rwxr-xr-x 1 sar 13792 Jan 22 22:22 changemod 
-rwxr-xr-x 1 sar 13824 Jan 22 22:22 times 


$ date 打印 当天 日 期 

Fri Jan 27 20:53:46 EST 2012 

$ ./a.out changemod times 运行 图 4-21 的 程序 

$ ls -1 changemod times 检查 结果 

-rwxr-xr-x 1 sar 0 Jan 22 01:26 changemod 

-rwxr-xr-x l sar 0 Jan 22 01:26 times 

$ ls -lu changemod times 检查 最 后 访问 时 间 

-rwxr-xr-x 1 sar 0 Jan 22 22:22 changemod 

-rwxr-xr-x 1 sar 0 Jan 22 22:22 times 

$ ls -lc changemod times 检查 状态 更 改 时 间 

-rwxr-xr-x 1 sar 0 Jan 27 20:53 changemod 

-rwxr-xr-x 1 sar 0 Jan 27 20:53 times 

正如 我 们 所 预见 的 一 样 ， 最 后 修改 时 间 和 最 后 访问 时 间 未 变 。 但 是 ， 状 态 更 改 时 间 则 更 改 为 
程序 运行 时 的 时 间 。 E 
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4.21 PAR mkdir, mkdirat ff] rmdir 


J mkdir 和 mkdirat 函数 创建 目录 ， 用 rmdir 函数 删除 目录 。 


#include <sys/stat.h> 
int mkdir(const char *pathname, mode_t mode) ; 
int mkdirat(int fd, const char *pathname, mode_t mode) ; 
两 个 函数 返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 
这 两 个 函数 创建 一 个 新 的 空 目 录 。 其 中 ，. 和 . .目录 项 是 自动 创建 的 。 所 指定 的 文件 访问 权 
限 mode 由 进程 的 文件 模式 创建 屏蔽 字 修 改 。 
常见 的 错误 是 指定 与 文件 相同 的 mode (只 指定 读 、 写 权限 )。 但 是 ， 对 于 目录 通常 至 少 要 设 
置 一 个 执行 权限 位 ， 以 允许 访问 该 目录 中 的 文件 名 〈 见 习题 4.16)。 
按照 4.6 节 中 讨论 的 规则 来 设置 新 目录 的 用 户 ID 和 组 ID。 
Solaris 10 和 Linux 3.2.0 也 使 新 目录 继承 父 目 录 的 设置 组 ID 位 。 这 就 使 得 在 新 目录 中 创建 的 
文件 将 继承 该 目录 的 组 ID。 对 于 Linux, 文件 系统 的 实现 决定 是 否 支持 此 特征 。 例 如 , ext2, ext3 
和 ext4 文件 系统 用 mount(1) 命 令 的 一 个 选项 来 控制 是 否 支 持 此 特征 。 但 是 ，Linux 的 UFS 文件 
系统 实现 则 是 不 可 选择 的 ， 新 目录 继承 父 目 录 的 设置 组 ID 位 ， 这 仿效 了 历史 上 BSD 的 实现 。 在 
BSD 系统 中 ， 新 目录 的 组 ID 是 从 父 目录 继承 的 。 
基于 BSD 的 系统 并 不 要 求 在 目录 间 传 递 设 置 组 ID 位 ,因为 不 论 设置 组 ID 位 如 何 , 新 创建 的 
文件 和 目录 总 是 继承 父 目 录 的 组 ID。 因为 FreeBSD 8.0 # Mac OS X 10.6.8 是 基于 4.4BSD 的 ， 它 
们 不 要 求 继承 设置 组 ID 位 。 在 这 些 平 台 上 ， 新 创建 的 文件 和 目录 总 是 继承 父 目 录 的 组 ID, ix 5 
是 否 设置 了 设置 组 ID 位 无 关 。 
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早期 的 UNIX 版 本 并 没有 mkdir 函数 ， 它 是 由 4.2BSD 和 SVR3 引入 的 。 在 早期 版 本 中 ， 进 
程 要 调用 mknod 函数 创建 一 个 新 目录 ， 但 是 只 有 超级 用 户 进程 才能 使 用 mknod 函数 。 为 了 避免 
这 一 点 ， 创 建 目录 的 命令 mkdir(1) 必 须 由 根 用 户 拥有 ， 而 且 对 它 设置 了 设置 用 户 ID 位 。 要 通过 
一 个 进程 创建 一 个 目录 ， 必 须 用 system(3) 函 数 调用 mkdir(1) 命 令 。 


mkdirat 函数 与 mkdir 函数 类 似 。 当 如 参数 具有 特殊 值 AT_FDCWD 或 者 pathname 参数 指 
定 了 绝对 路 径 名 时 ，mkdirat 5E mkdir 完全 一 样 。 和 否则 ， 妈 参数 是 一 个 打开 目录 ， 相 对 路 径 名 
根据 此 打开 目录 进行 计算 。 
129 用 rmdir 函数 可 以 删除 一 个 空 目录 。 空 目录 是 只 包含 .和 . .这 两 项 的 目录 。 





如 果 调 用 此 函数 使 目录 的 链接 计数 成 为 0，， 并 且 也 没有 其 他 进程 打开 此 目录 ， 则 释放 由 此 目 
录 占 用 的 空间 。 如 果 在 链接 计数 达到 0 时 ， 有 一 个 或 多 个 进程 打开 此 目录 ， 则 在 此 函数 返回 前 删 
除 最 后 一 个 链接 及 .和 . .项 。 另 外 ， 在 此 目录 中 不 能 再 创建 新 文件 。 但 是 在 最 后 一 个 进程 关闭 它 
之 前 并 不 释放 此 目录 。( 即 使 男 一 些 进程 打开 该 目录 ， 它 们 在 此 目录 下 也 不 能 执行 其 他 操作 。 这 
样 处 理 的 原因 是 ， 为 了 使 rmdir 函数 成 功 执行 ， 该 目录 必须 是 空 的 。) 


4.22 ZEAR 


对 某 个 目录 具有 访问 权限 的 任 一 用 户 都 可 以 读 该 目录 ， 但 是 ， 为 了 防止 文件 系统 产生 混乱 ， 
只 有 内 核 才 能 写 目 录 。 回 忆 4.5 节 ， 一 个 目录 的 写 权限 位 和 执行 权限 位 决定 了 在 该 目录 中 能 否 创 
建新 文件 以 及 删除 文件 ， 它 们 并 不 表示 能 否 写 目 录 本 身 。 

目录 的 实际 格式 依赖 于 UNIX 系统 实现 和 文件 系统 的 设计 。 早 期 的 系统 (如 V7) 有 一 个 比 
较 简 单 的 结构 : a, 16 个 字 节 ， 其 中 14 个 字 节 是 文件 名 ，2 个 字 节 是 i 节点 编号 。 而 
对 于 4.2BSD， 它 允 许 更 长 的 文件 名 ， 所 以 每 个 目录 项 的 长 度 是 可 变 的 。 这 就 意味 着 读 目录 的 
程序 与 ARA. x CN B REOR. UNIX 现在 包含 了 一 套 与 目录 有 关 的 例 程 ， 它 们 是 
POSIX.1 的 一 部 分 。 很 多 实现 阻止 应 用 程序 使 用 read 函数 读 取 目 录 的 内 容 ， 由 此 进一步 将 应 用 
程序 与 目录 格式 中 与 实现 相关 的 细节 隔离 。 


#include <dirent.h> 
DIR *opendir(const char *pathname) ; 


DIR *fdopendir(int fd); 
两 个 函数 返回 值 : 若 成 功 ， 返 回 指针 ; didi. El NULL 


struct dirent *readdir(DIR *dp); 


返回 值 ， 若 成 功 ， 返 回 指针 ; 若 在 目录 尾 或 出 错 ， 返 回 NULL 
void rewinddir(DIR *dp); 


int closedir(DIR *dp); 
返回 值 : 车 成 功 ， 返 回 0; 车 出 错 ， 返 回 -1 


long telldir(DIR *dp); 


返回 值 : 与 gp 关联 的 目录 中 的 当前 位 置 





void seekdir(DIR *dp, 
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fdopendir 函数 最 早出 现在 SUSv4 (Single UNIX Specification 第 4 版) 中 ， 它 提供 了 一 种 
方法 ， 可 以 把 打开 文件 描述 符 转换 成 目录 处 理 函 数 需要 的 DIR 结构 。 
telldir 和 seekdir 函数 不 是 基本 POSIX.1 标准 的 组 成 部 分 。 它 们 是 Single UNIX 
Specification 中 的 XSI 扩展 ， 所 以 可 以 期 望 所 有 符合 UNIX 系统 的 实现 都 会 提供 这 两 个 函数 。 
回忆 一 下 ， 在 图 1-3 程序 中 (1s 命令 的 基本 实现 部 分 ) 使 用 了 其 中 几 个 函数 。 
定义 在 头 文件 <dirent .h> 中 的 dirent 结构 与 实现 有 关 。 实 现 对 此 结构 所 做 的 定义 至 少 包 
含 下 列 两 个 成 员 : 
ino_t d_ino; /* i-node number */ 
char d_name[]; /* null-terminated filename */ 


POSIX.1 并 没有 定义 d_ino 项, 因为 这 是 一 个 实现 特征 , 但 在 POSIX.1 的 XSI 扩展 中 定义 了 
d_ino。POSIX.1 在 此 结构 中 只 定义 了 d name 项 。 


VER, d name 项 的 大 小 并 没有 指定 ， 但 必须 保证 它 能 包含 至 少 NAME_MAX 个 字 节 (不 包含 
终止 null 字 节 ， 回 忆 图 2-15)。 因 为 文件 名 是 以 null 字 节 结束 的 ， 所 以 在 头 文件 中 如 何 定 义 数组 
d name 并 无 多 大 关系 ， 数 组 大 小 并 不 表示 文件 名 的 长 度 。 

DIR 结构 是 一 个 内 部 结构 ， 上 述 7 个 函数 用 这 个 内 部 结构 保存 当前 正在 被 读 的 目录 的 有 
关 信 息 。 其 作用 类 似 于 FILE 结构 。FILE 结构 由 标准 VO 库 维护 ， 我 们 将 在 第 5 章 中 对 它 进 
行 说 明 。 

由 opendir 和 fdopendir 返回 的 指向 DIR 结构 的 指针 由 男 外 5 个 函数 使 用 .opendir 执 
行 初始 化 操作 ， 使 第 一 个 readdir 返回 目录 中 的 第 一 个 目录 项 。DIR 结构 由 fdopendir 创建 
时 ，readdir 返回 的 第 一 项 取决 于 传 给 fdopendir 函数 的 文件 描述 符 相 关联 的 文件 偏 移 量 。 注 
意 ， 目 录 中 各 目录 项 的 顺序 与 实现 有 关 。 它 们 通常 并 不 按 字 母 顺序 排列 。 


TEN] 

我 们 将 使 用 这 些 对 目录 进行 操作 的 例 程 编写 一 个 遍历 文件 层次 结构 的 程序 ， 其 目的 是 得 
到 如 图 4-4 中 所 示 的 各 种 类 型 的 文件 计数 。 图 4-22 的 程序 只 有 一 个 参数 ， 它 说 明 起 点 路 径 名 ， 
从 该 点 开始 递归 降序 遍历 文件 层次 结构 。Solaris 提供 了 一 个 遍历 此 层次 结构 的 函数 ftw(3)， 
对 于 每 一 个 文件 它 都 调用 一 个 用 户 定义 的 函数 。ftw 函数 的 问题 是 : 对 于 每 一 个 文件 ， 它 都 
调用 stat 函数 ， 这 就 使 程序 跟随 符号 链接 。 例 如 ， 如 果 从 根 目 录 (root) 开始 ， 并 且 有 一 个 
名 为 /1ib 的 符号 链接 ， 它 指向 /usr/1ib， 则 所 有 在 目录 /usr/1ib 中 的 文件 都 会 被 计数 两 
次 。 为 了 纠正 这 一 点 ，Solaris 提供 了 另 一 个 函数 nftw(3)， 它 具有 一 个 停止 跟随 符号 链接 的 
选项 。 尽 管 可 以 使 用 nftw, 但 是 为 了 说 明 目 录 例 程 的 使 用 方法 ,我 们 还 是 编写 了 一 个 简单 的 

文件 遍历 程序 。 
在 SUSv4 中 ，nftw 包含 在 XSI 选项 中 。FreeBSD 8.0, Linux 3.2.0, Mac OS X 10.6.8 以 及 Solaris 10 
都 包括 了 该 函数 的 实现 。( 在 SUSv4 P, ftw 函数 已 被 标记 为 弃 用 。 ) AT BSD 的 UNIX 系统 则 有 另 一 个 
HH fts(3)， 它 提供 类 似 的 功能 。 该 函数 在 FreeBSD 8.0、Linux 3.2.0 f» Mac OS X 10.6.8 中 是 可 用 的 。 








#include "apue.h" 
#include <dirent.h> 
#include <limits.h> 
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/* function type that is called for each filename */ 
typedef int Myfunc(const char *, const struct stat *, int); 


static Myfunc myfunc; 

static int myftw(char *, Myfunc *); 

static int dopath (Myfunc *); 

static long nreg, ndir, nblk, nchr, nfifo, nslink, nsock, ntot; 


int 
main(int argc, char *argv[]) 
{ 
int ret; 
if (arge != 2) 
err_quit("usage: ftw <starting-pathname>") ; 


ret = myftw(argv[1], myfunc); /* does it all */ 
ntot = nreg + ndir + nblk + nchr + nfifo + nslink + nsock; 
if (ntot == 0) 
ntot = 1; /* avoid divide by 0; print 0 for all counts */ 


printf("regular files $71d, $5.2f %%\n", nreg, 
nreg*100.0/ntot); 

printf("directories 
ndir*100.0/ntot); 

printf("block special = $71d, $5.2f %%\n", nblk, 
nblk*100.0/ntot); 

printf("char special 
nchr*100.0/ntot); 

printf("FIFOs = $71d, $5.2f %%\n", nfifo, 
nfifo*100.0/ntot); 

printf("symbolic links = $71d, %5.2f %%\n", nslink, 
nslink*100.0/ntot) ; 

printf ("sockets = &71d, $5.2f %%\n", nsock, 
nsock*100.0/ntot) ; 

exit (ret); 


&71d, $5.2f &%\n", ndir, 


$71d, %5.2£ VIAT, ACHT, 


} 


/* 
* Descend through the hierarchy, starting at "pathname". 
* The caller's func() is called for every file. 


* 

/ 

#define FTW F 1 /* file other than directory */ 

#define FTW D 2 /* directory */ 

#define FTW DNR 3 /* directory that can't be read */ 

#define FTW NS 4 /* file that we can't stat */ 

static char *fullpath; /* contains full pathname for every file */ 


static size t pathlen; 


static int /* we return whatever func() returns */ 
myftw(char *pathname, Myfunc *func) 
{ 
fullpath = path alloc(&pathlen); /* malloc PATH _MAX+1 bytes */ 
/* ({Flgure 2.16}) */ 
if (pathlen <= strlen(pathname)) { 
pathlen = strlen(pathname) * 2; 
if ((fullpath = realloc(fullpath, pathlen)) == NULL) 
err_sys("realloc failed"); 
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} 
strcpy(fullpath, pathname) ; 
return (dopath (func) ); 
} 
/* 
* Descend through the hierarchy, starting at "fullpath". 
* If "fullpath" is anything other than a directory, we lstat() it, 
* call func(), and return. For a directory, we call ourself 
* recursively for each name in the directory. 
of 
static int /* we return whatever func() returns */ 
dopath (Myfunc* func) 
{ 
struct stat statbuf; 
struct dirent *dirp; 
DIR *dp; 
int ret, n; 
if (lstat(fullpath, &statbuf) < 0) /* stat error */ 
return(func(fullpath, &statbuf, FTW NS)); 
if (S ISDIR(statbuf.st mode) -- 0) /* not a directory */ 
return(func(fullpath, &statbuf, FTW F)); 
/* 
* It's a directory. First call func() for the directory, 
* then process each filename in the directory. 
sy 
if ((ret = func(fullpath, &statbuf, FTW_D)) != 0) 
return (ret); 
n = strlen(fullpath); 
if (n + NAME_MAX + 2 > pathlen) { /* expand path buffer */ 
pathlen *= 2; 
if ((fullpath = realloc(fullpath, pathlen)) == NULL) 
err_sys("realloc failed"); 
} 
fullpath[nt++] = '/'; 
fullpath[n] = 0; 
if ((dp = opendir(fullpath)) == NULL) /* can't read directory */ 
return(func(fullpath, &statbuf, FTW_DNR)); 
while ((dirp = readdir(dp)) != NULL) { 
if (strcmp(dirp-»d name, ".") == | 
strcmp(dirp-»d name, "..") == 0) 
continue; /* ignore dot and dot-dot */ 
strcpy(&fullpath[n], dirp-»d name); /* append name after Bye wy 
if ((ret = dopath(func)) != 0) /* recursive */ 


break; /* time to leave */ 
} 
fullpath[n-1] = 0; /* erase everything from slash onward */ 
if (closedir(dp) < 0) 
err_ret("can't close directory %s", fullpath); 
return (ret); 
} 
static int 
myfunc(const char *pathname, const struct stat *statptr, int type) 


{ 
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switch (type) { 


case FTW F: 
switch (statptr-»st mode & S IFMT) { 
case S IFREG: nregtt+; break; 
case S_IFBLK: nbl k++; break; 
case S_IFCHR: nchr4*; break; 
case S IFIFO: nfifot*; break; 
case S IFLNK: nslink**; break; 
case S IFSOCK: nsock-**; break; 


case S IFDIR: /* directories should have type - FTW D */ 
err dump("for S IFDIR for $s", pathname); 
} 
break; 
case FTW_D: 
ndir++; 
break; 
case FTW_DNR: 
err ret("can't read directory %s", pathname); 
break; 
case FTW NS: 
err ret("stat error for %s", pathname); 
break; 
default: 
err dump("unknown type %d for pathname $s", type, pathname); 


) 


return(0); 


图 4-22 ”递归 降序 遍历 目录 层次 结构 ， 并 按 文件 类 型 计数 
在 程序 中 ， 我 们 提供 了 比 所 要 求 的 更 多 的 通用 性 ， 这 样 做 的 目的 是 为 了 有 具体 说 明 ftw 和 nftw 函数 
的 应 用 。 例 如 ， 函 数 myfunc 总 是 返回 0， 即 使 调用 它 的 函数 准备 了 处 理 非 0 返回 也 是 如 此 。 E 
关于 降序 过 历 文件 系统 的 更 多 信息 ， 以 及 在 很 多 标准 UNIX 命令 (如 find, 1s. tar 55) 
中 使 用 这 种 技术 的 情况 ， 请 参阅 Fowler. Korn 和 Vo[1989]. 


4.23 PAM chdir, fchdir 和 getcwd 


每 个 进程 都 有 一 个 当前 工作 目录 ， 此 目录 是 搜索 所 有 相对 路 径 名 的 起 点 (不 以 斜 线 开 始 的 路 
径 名 为 相对 路 径 名 )。 当 用 户 登 录 到 UNIX. 系统 时 ， 其 当前 工作 目录 通常 是 口令 文件 
(/etc/passwd) 中 该 用 户 登 录 项 的 第 6 个 字段 一 一 用 户 的 起 始 目 录 (home. directory )。 当 前 工 
作 目 录 是 进程 的 一 个 属性 ， 起 始 目 录 则 是 登录 名 的 一 个 属性 。 

进程 调用 chdir 或 fchdir 函数 可 以 更 改 当前 工作 目录 。 





#include <unistd.h> 
int chdir(const char *pathname) ; 


int fchdir(int fd); 





两 个 函数 的 返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 
在 这 两 个 函数 中 ， 分 别 用 pathname 或 打开 文件 描述 符 来 指定 新 的 当前 工作 目录 。 
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时 实例 


因为 当前 工作 目录 是 进程 的 一 个 属性 ， 所 以 它 只 影响 调用 chdir 的 进程 本 身 ， 而 不 影响 其 
他 进程 〈 我 们 将 在 第 8 章 更 详细 地 说 明 进程 之 间 的 关系 )。 这 就 意味 着 图 4-23 的 程序 并 不 会 产生 
我 们 可 能 希望 得 到 的 结果 。 


#include "apue.h" 





int 
main (void) 
{ 
if (chdir("/tmp") < 0) 
err_sys("chdir failed"); 
printf ("chdir to /tmp succeeded\n") ; 
exit (0); 


图 4-23 chdir 函数 实例 
如 果 编 译 图 4-23 程序 ， 并 且 调 用 其 可 执行 目标 代码 文件 mycd， 则 可 以 得 到 下 列 结果 : 
$ pwd 
/usr/lib 
$ mycd 
chdir to /tmp succeeded 
$ pwd 
/usr/lib 


从 中 可 以 看 出 ， 执 行 mycd 命令 的 shell 的 当前 工作 目录 并 没有 改变 ， 这 是 shell 执行 程序 工作 方 
式 的 一 个 副作用 。 每 个 程序 运行 在 独立 的 进程 中 ，shell 的 当前 工作 目录 并 不 会 随 着 程序 调用 
chdir 而 改变 。 由 此 可 见 , 为 了 改变 shell 进程 自己 的 工作 目录 , shell 应 当 直 接 调 用 chdir 函数 ， 
为 此 ，cd 命令 内 建 在 shell 中 。 
因为 内 核 必 须 维 护 当 前 工作 目录 的 信息 ， 所 以 我 们 应 能 获取 其 当前 值 。 遗憾 的 是 ， 内 核 
为 每 个 进程 只 保存 指向 该 目录 v 节点 的 指针 等 目录 本 身 的 信息 ， 并 不 保存 该 目录 的 完整 路 
径 名 。 
Linux 内 核 可 以 确定 完整 路 径 名 。 完 整 路 径 名 的 各 个 组 成 部 分 分 布 在 mount 表 和 dcache 表 
中 ， 然 后 进行 重新 组 装 ， 上 比如 在 读 取 /proc/self/cwd 符号 链接 时 。 


我 们 需要 一 个 函数 ， 它 从 当前 工作 目录 〈. ) 开始 ， 用 . .找到 其 上 一 级 目录 ， 然 后 读 其 目录 
项 ， 直 到 该 目录 项 中 的 i 节点 编号 与 工作 目录 i 节点 编号 相同 ， 这 样 地 就 找到 了 其 对 应 的 文件 名 。 
按照 这 种 方法 ， 逐 层 上 移 ， 直 到 遇 到 根 ， 这 样 就 得 到 了 当前 工作 目录 完整 的 绝对 路 径 名 。 很 幸运 ， 
函数 getcwd 就 提供 了 这 种 功能 。 


#include <unistd.h> 


char *getcwd(char *buf, size_t size); 





返回 值 : 若 成 功 ， 返 回 bwf; 若 出 错 ， 返 回 NULL 


必须 向 此 函数 传递 两 个 参数 ， 一 个 是 缓冲 区 地 址 buf, 另 一 个 是 缓冲 区 的 长 度 size《〈 以 字 节 为 
单位 )。 该 缓冲 区 必须 有 足够 的 长 度 以 容纳 绝对 路 径 名 再 加 上 一 个 终止 null 字 节 ， 否 则 返回 出 错 
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(请 回忆 2.5.5 节 中 有 关 为 最 大 长 度 路 径 名 分 配 空间 的 讨论 )。 


某 些 getcwd 的 早期 实现 允许 第 一 个 参数 buf 为 NULL。 在 这 种 情况 下 ， 此 函数 调用 malloc 
动态 地 分 配 size 字 节 数 的 空间 。 这 不 是 POSIX.1 或 Single UNIX Specification 的 所 属 部 分 ， 应 当 避 
免 使 用 。 


Esi! 


图 4-24 的 程序 将 工作 目录 更 改 至 一 个 指定 的 目录 ， 然 后 调用 getcwd， 最 后 打印 该 工作 
目录 。 如 果 运 行 该 程序 ， 则 可 得 

$ ./a.out 

cwd = /var/spool/uucppublic 


$ 1s -1 /usr/spool 
lrwxrwxrwx 1 root 12 Jan 31 07:57 /usr/spool -> ../var/spool 


#include "apue.h" 
int 
main(void) 
{ 
char *ptr; 
size_t size; 
if (chdir("/usr/spool/uucppublic") < 0) 
err_sys("chdir failed"); 
ptr = path alloc(&size); /* our own function */ 
if (getcwd(ptr, size) == NULL) 
err sys("getcwd failed"); 
printf("cwd = %s\n", ptr); 
exit(0); 


图 4-24 getcwd 函数 实例 

YER, chdir 跟随 符号 链接 (正如 我 们 希望 的 ， 如 图 4-17 中 所 示 )， 但 是 当 getcwd WAR 
bi EWS /var/spool 目录 时 ， 它 并 不 了 解 该 目录 由 符号 链接 /usr/spool 所 指向 。 这 是 符 
号 链接 的 一 种 特性 。 * 

当 一 个 应 用 程序 需要 在 文件 系统 中 返回 到 它 工作 的 出 发 点 时 ，getcwd 函数 是 有 用 的 。 
在 更 换 工作 目录 之 前 ， 我 们 可 以 调用 getcwd 函数 先 将 其 保存 起 来 。 在 完成 了 处 理 后 ， 就 可 
将 所 保存 的 原 工作 目录 路 径 名 作为 调用 参数 传送 给 chdir, 这 样 就 返回 到 了 文件 系统 中 的 出 

fchdir 函数 向 我 们 提供 了 一 种 完成 此 任务 的 便捷 方法 。 在 更 换 到 文件 系统 中 的 不 同位 置 前 ， 
无 需 调 用 getcwd 函数 ， 而 是 使 用 open 打开 当前 工作 目录 ， 然 后 保存 其 返回 的 文件 描述 符 。 当 
希望 回 到 原 工 作 目录 时 ， 只 要 简单 地 将 该 文件 描述 符 传送 给 £chdir. 


4.24 ”设备 特殊 文件 


st dev 和 st_rdev 这 两 个 字段 经 常 引起 混淆 ,在 18.9 5, 我 们 编写 ttyname MAN, m 
要 使 用 这 两 个 字段 。 有 关 规 则 很 简单 : 


à 


int 


a 


TES) 
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每 个 文件 系统 所 在 的 存储 设备 都 由 其 主 、 次 设备 号 表示 。 设 备 号 所 用 的 数据 类 型 是 
基本 系统 数据 类 型 dev_t。 主 设备 号 标识 设备 驱动 程序 ， 有 时 编码 为 与 其 通信 的 外 
wR: 次 设备 号 标识 特定 的 子 设备 。 回 忆 图 4-13， 一 个 磁盘 驱动 器 经 常 包含 若干 个 
文件 系统 。 在 同一 磁盘 驱动 器 上 的 各 文件 系统 通常 具有 相同 的 主 设备 号 ， 但 是 次 设 
备 号 却 不 同 。 

我 们 通常 可 以 使 用 两 个 宏 : major 和 minor 来 访问 主 、 次 设备 号 ， 大 多 数 实现 都 定义 这 
两 个 宏 。 这 就 意味 着 我 们 无 需 关 心 这 两 个 数 是 如 何 存放 在 dev_t 对 象 中 的 。 

早期 的 系统 用 16 位 整 型 存放 设备 号 : 8 位 用 于 主 设备 号 ，8 位 用 于 次 设备 号 。FreeBSD 8.0 

f» Mac OS X 10.6.8 使 用 32 位 整 型 ， 其 中 8 位 表示 主 设备 号 ，24 位 表示 次 设备 号 。 在 32 位 系 
统 中 ，Solaris 10 用 32 位 整 型 表示 dev t, HP 14 位 用 于 主 设 备 号 ，18 位 用 于 次 设备 号 。 在 
64 位 系统 中 ，Solaris 10 用 64 位 整 型 表示 dev 七 ， 主 设备 号 和 次 设备 号 各 用 其 中 的 32 位 表示 。 
Æ Linux 3.2.0 上 ， 虽 然 dev t 是 64 位 整 型 ， 但 其 中 只 有 12 位 用 于 主 设备 号 ，20 位 用 于 次 设 
备 号 。 

| POSIX.1 说 明 dev t 类 型 是 存在 的 ， 但 没有 定义 它 包 含 什么 ， 或 如 何 取得 其 内 容 。 大 多 数 实 
现 定义 了 宏 major 和 minor， 但 在 哪 一 个 头 文件 中 定义 它们 则 与 实现 有 关 。 基 于 BSD 的 UNIX 
系统 将 它们 定义 在 <sys/types> 中 。Solaris 在 <sys/mkdev.h> 中 定义 了 它们 的 函数 原型 ， 
”因为 在 <sys/sysmacros.h> 中 的 宏 定 义 都 齐 用 了 。Linux 将 它们 定义 在 <sys/sysmacros.h> 
”中 ， 而 该 头 文件 又 包含 在 <sys/type.h> 中 。 


系统 中 与 每 个 文件 名 关联 的 st dev 值 是 文件 系统 的 设备 号 ， 该 文件 系统 包含 了 这 一 文 
件 名 以 及 与 其 对 应 的 i 节点 。 
只 有 字符 特殊 文件 和 块 特殊 文件 才 有 st_rdev 值 。 此 值 包含 实际 设备 的 设备 号 。 


图 4-25 的 程序 为 每 个 命令 行 参数 打印 设备 号 , 另外 ， 若 此 参数 引用 的 是 字符 特殊 文件 或 块 特 
殊 文 件 ， 则 还 打印 该 特殊 文件 的 st_rdev 值 。 


#include "apue.h" 
#ifdef SOLARIS 
#include <sys/mkdev.h> 
#fendif 





main(int argc, char *argv[]) 


{ 


int 


i; 


struct stat buf; 


for (4 = le i < argo; 246) d 


printf("9Ss: T, argv[i]); 
if (stat(argv[i], &buf) « O) ( 
err ret("stat error"); 


continue; 
} 
printf ("dev = %d/%d", major(buf.st dev), minor (buf.st_dev)); 
if (S_ISCHR(buf.st_mode) || S_ISBLK(buf.st_mode)) { 


printf(" ($s) rdev = $d/$d", 
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(S ISCHR(buf.st mode)) ? "character" : "block", 
major(buf.st rdev), minor(buf.st rdev)); 
) 
printf ("Mn"); 
} 
exit(0); 


K 4-25 FTE st dev All st_rdev ffi 
在 Linux 上 运行 此 程序 得 到 下 面 的 输出 : 


$ ./a.out / /home/sar /dev/tty[01] 
/: dev = 8/3 
/home/sar: dev 
/dev/tty0: dev 0/5 (character) rdev - 4/0 

/dev/ttyl: dev 0/5 (character) rdev - 4/1 

$ mount 哪些 目录 安装 在 哪些 设备 上 ? 
/dev/sda3 on / type ext3 (rw, errors=remount-ro, commit=0) 
/dev/sda4 on /home type ext2 (rw, commit=0) 

$ ls -1 /dev/tty[01] /dev/sda[34] 


8/4 


"ow ow 


brw-rw---- 1 root 8, 3 2011-07-01 11:08 /dev/sda3 
brw-rw---- 1 root 8, 4 2011-07-01 11:08 /dev/sda4 
crw--w---- 1 root 4, 0 2011-07-01 11:08 /dev/ttyO 
CIW= 一 一 一 一 一 一 1 root 4, 1 2011-07-01 11:08 /dev/ttyl 


传 给 该 程序 的 前 两 个 参数 是 目录 (/ 和 /home/sar)， 后 两 个 参数 是 设备 名 /dev/tty[01] 。( 我 
们 用 shell 正则 表达 式 语 言 以 缩短 所 需 的 输入 量 。shell 将 字符 串 /dev/tty[01] 扩 展 为 
/dev/ttyO /dev/ttyl.) 

我 们 期 望 设备 是 字符 特殊 文件 。 从 程序 的 输出 可 见 ， 根 目录 和 /home/sar 目录 的 设备 号 不 
同 ， 这 表示 它们 位 于 不 同 的 文件 系统 中 。 运 行 mount(1) 命 令 可 以 证 明了 这 一 点 。 

然后 用 1s 命令 查看 由 mount 命令 报告 的 两 个 磁盘 设备 和 两 个 终端 设备 。 这 两 个 磁盘 设备 是 
块 特殊 文件 ， 而 两 个 终端 设备 是 字符 特殊 文件 。( 通 常 ， 只 有 那些 包含 随机 访问 文件 系统 的 设备 
类 型 是 块 特殊 文件 设备 ， 如 硬盘 驱动 器 、 软 盘 驱 动 器 和 CD-ROM 等 。UNIX 的 早期 版 本 支持 磁带 
存放 文件 系统 ， 但 这 从 未 广泛 使 用 过 。) 

注意 ， 两 个 终端 设备 (st_dev) 的 文件 名 和 i 节点 在 设备 0/5 E (devtmpfs 伪 文 件 系统 ， 

它 实现 了 /dev 文件 系统 )， 但 是 它们 的 实际 设备 号 是 4/0 和 4/1。 


4.25 ”文件 访问 权限 位 小 结 


我 们 已 经 说 明了 所 有 文件 访问 权限 位 , 其 中 某 些 位 有 多 种 用 途 。 图 4-26 列 出 了 所 有 这 些 权限 
位 ， 以 及 它们 对 普通 文件 和 目录 文件 的 作用 。 

最 后 9 个 常量 还 可 以 分 成 如 下 3 组 : 
S_IRUSR | S_IWUSR | S_IXUSR 


S_IRGRP | S_IWGRP | S_IXGRP 
S_IROTH | S_IWOTH | S IXOTH 


S IRWXU 
S IRWXG 
S IRWXO 
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对 普通 文件 的 影响 对 目录 的 影响 













S ISUID 设置 用 户 ID | 执行 时 设置 有 效用 户 ID (未 使 用 ) 
S_ISGID 设置 组 ID 若 组 执行 位 设置 ， 则 执行 时 设置 有 效 将 在 目录 中 创建 的 新 文件 的 组 ID 
组 ID: 否则 使 强制 性 锁 起 作用 ( 若 支 持 ) | 设置 为 目录 的 组 ID 


在 交换 区 缓存 程序 正文 (车 支持 ) 限 止 在 目录 中 删除 和 重 命名 文件 











S_IRUSR 用 户 读 许可 用 户 读 文件 许可 用 户 读 目 录 项 

S_IWUSR 用 户 写 许可 用 户 写 文件 许可 用 户 在 目录 中 删除 和 创建 文件 
S IXUSR 用 户 执 行 许可 用 户 执行 文件 许可 用 户 在 目录 中 搜索 给 定 路 径 名 
S IRGRP 组 读 许可 组 读 文件 许可 组 读 目 录 项 

S IWGRP 组 写 许可 组 写 文件 许可 组 在 目录 中 删除 和 创建 文件 
S_IXGRP 组 执行 许可 组 执行 文件 许可 组 在 目录 中 搜索 给 定 路 径 名 
S_IROTH 其 他 读 许可 其 他 读 文 件 许可 其 他 读 目录 项 

S_IWOTH 其 他 写 许可 其 他 写 文件 许可 其 他 在 目录 中 删除 和 创建 文件 






其 他 执行 许可 其 他 执行 文件 


图 4-26 文件 访问 权限 位 小 结 


S IXOTH 许可 其 他 在 目录 中 搜索 给 定 路 径 名 





4.26 ”小结 


本 章 内 容 围绕 stat 函数 ， 详 细 介 绍 了 stat 结构 中 的 每 一 个 成 员 。 这 使 我 们 对 UNIX 文件 
和 目录 的 各 个 属性 都 有 所 了 解 。 我 们 讨论 了 文件 和 目录 在 文件 系统 中 是 如 何 设计 的 以 及 如 何 使 用 
文件 系统 命名 空间 。 对 文件 和 目录 的 所 有 属性 以 及 对 文件 和 目录 进行 操作 的 所 有 函数 的 全 面 了 
解 ， 对 于 UNIX 编程 是 非常 重要 的 。 


习题 


4.1 用 stat 函数 替换 图 4-3 程序 中 的 1stat 函数 ， 如 若 命令 行 参数 之 一 是 符号 链接 ， 会 发 生 
什么 变化 ? 

42 “如 果 文 件 模式 创建 屏蔽 字 是 777 (八进制 ), 结果 会 怎样 ? 用 shell 的 umask 命令 验证 该 结果 。 

43 ”关闭 一 个 你 所 拥有 文件 的 用 户 读 权限 ， 将 导致 拒绝 你 访问 自己 的 文件 ， 对 此 进行 验证 。 

4.4 ”创建 文件 foo 和 bar 后 ， 运 行 图 4-9 的 程序 ， 将 发 生 什么 情况 ? 

45 4.12 节 中 讲 到 一 个 普通 文件 的 大 小 可 以 为 0， 同时 我 们 又 知道 st size 字段 是 为 目录 或 符 
号 链接 定义 的 ， 那 么 目录 和 符号 链接 的 长 度 是 否 可 以 为 0? 

4.6 ”编写 一 个 类 似 cp(1) 的 程序 ， 它 复制 包含 空洞 的 文件 ， 但 不 将 字 节 0 写 到 输出 文件 中 去 。 

4.7 在 4.12 节 1s 命令 的 输出 中 ，core 和 core .copy 的 访问 权限 不 同 ， 如 果 创 建 两 个 文件 时 
umask 没有 变 ， 说 明 为 什么 会 发 生 这 种 差别 。 

4.8 ”在 运行 图 4-16 的 程序 时 ， 使 用 了 daf() 命 令 来 检查 空闲 的 磁盘 空间 。 为 什么 不 使 用 du (D) 
命令 ? 

4.9 图 4-20 中 显示 unlink 函数 会 修改 文件 状态 更 改 时 间 ， 这 是 怎样 发 生 的 ? 

4.10 422 节 中 ， 系 统 对 可 打开 文件 数 的 限制 对 myftw 函数 会 产生 什么 影响 ? 

4.1 1E422 节 中 的 myftw 从 不 改变 其 目录 ， 对 这 种 处 理 方法 进行 改动 : 每 次 遇 到 一 个 目录 就 用 
其 调用 chdir, 这 样 每 次 调用 1stat 时 就 可 以 使 用 文件 名 而 非 路 径 名 ， 处 理 完 所 有 的 目录 
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4.12 


4.13 
4.14 


4.16 


4.17 


项 后 执行 chdir ("..")。 上 比较 这 种 版 本 的 程序 和 书 中 程序 的 运行 时 间 。 

每 个 进程 都 有 一 个 根 目录 用 于 解析 绝对 路 径 名 ， 可 以 通过 chroot 函数 改变 根 目录 。 在 手 
册 中 查阅 此 函数 。 说 明 这 个 函数 什么 时 候 有 用 。 

如 何 只 设置 两 个 时 间 值 中 的 一 个 来 使 用 utimes 函数 ? 

有 些 版 本 的 finger(1) 命 令 输 出 “New mail received ...” 和 “unread since ...”， 其 中 ... 表 示 
相应 的 日 期 和 时 间 。 程 序 是 如 何 决定 这 些 日 期 和 时 间 的 ? 

用 cpio(1) 和 tar(1) 命 令 检 查 档 案 文件 的 格式 (请 参阅 《UNIX 程序 员 手册 》 第 5 部 分 中 的 
说 明 )。3 个 可 能 的 时 间 值 中 哪儿 个 是 为 每 一 个 文件 保存 的 ?你 认为 文件 复原 时 ， 文 件 的 访 
问 时 间 是 什么 ?为 什么 ? 

UNIX 系统 对 目录 树 的 深度 有 限制 吗 ? 编写 一 个 程序 循环 ， 在 每 次 循环 中 ,创建 目录 ， 并 将 
该 目录 更 改 为 工作 目录 。 确 保 叶 节点 的 绝对 路 径 名 的 长 度 大 于 系统 的 PATH MAX 限制 。 可 
以 调用 getcwd 得 到 目录 的 路 径 名 吗 ? 标准 UNIX 系统 工具 是 如 何 处 理 长 路 径 名 的 ? 对 目 
录 可 以 使 用 tar 或 cpio 命令 归档 吗 ? 

3.16 节 中 描述 了 /dev/fd 特征 。 如 果 每 个 用 户 都 可 以 访问 这 些 文件 ， 则 其 访问 权限 必须 为 
rw-rw-rw-。 有 些 程序 创建 输出 文件 时 , 先 删 除 该 文件 以 确保 该 文件 名 不 存在 , 忽略 返回 码 。 
unlink (path); 


if ( (fd = creat (path, FILE MODE)) < 0) 
err_sys(...)? 


如 果 path 是 /dev/fd/1， 会 出 现 什 么 情况 ? 


SB D Ri 
标准 |/O FE 





5.1 引言 


本 章 讲述 标准 IO FE. 不仅 是 UNIX, 很 多 其 他 操作 系统 都 实现 了 标准 VO 库 ， 所 以 这 个 库 由 
ISO C 标准 说 明 。Single UNIX Specification 对 ISO C 标准 进行 了 扩充 ， 定 义 了 另外 一 些 接口 。 

标准 VO 库 处 理 很 多 细节 ， 如 缓冲 区 分 配 、 以 优化 的 块 长 度 执行 VO 等 。 这 些 处 理 使 用 户 不 
必 担 心 如 何 选择 使 用 正确 的 块 长 度 〈 如 3.9 节 中 所 述 )。 这 使 得 它 便 于 用 户 使 用 ,但 是 如 果 我 们 不 
深入 地 了 解 IO 库 函 数 的 操作 ， 也 会 带 来 一 些 问 题 。 


标准 IO 库 是 由 Dennis Ritchie 在 1975 年 左右 编写 的 。 它 是 Mike Lesk 编写 的 可 移植 IO 库 的 
主要 修改 版 本 。 令 人 惊讶 的 是 ，35 年 来 ， 几 乎 没有 对 标准 VO 库 进 行 修改 。 


5.2 流 和 FILE WR 


在 第 3 章 中 , 所 有 VO 函数 都 是 围绕 文件 描述 符 的 。 当 打开 一 个 文件 时 , 即 返回 一 个 文件 描述 符 ， 
然后 该 文件 描述 符 就 用 于 后 续 的 VO 操作 。 而 对 于 标准 VO 库 ， 它 们 的 操作 是 围绕 流 (stream) 进行 
的 (请 勿 将 标准 1/O 术语 流 与 System V 的 STREAMS IO 系统 相 混淆 , STREAMS IO 系统 是 System V 
的 组 成 部 分 ，Single UNIX Specification 则 将 其 标准 化 为 XSI STREAMS 选项 ， 但 是 在 SUSv4 中 已 经 
将 其 标记 为 弃 用 )。 当 用 标准 VO 库 打 开 或 创建 一 个 文件 时 ， 我 们 已 使 一 个 流 与 一 个 文件 相关 联 。 

对 于 ASCH 字符 集 ， 一 个 字符 用 一 个 字 节 表示 。 对 于 国际 字符 集 ， 一 个 字符 可 用 多 个 字 节 表 
示 。 标 准 VO 文件 流 可 用 于 单字 节 或 多 字 节 (“ 宽 ”) 字符 集 。 流 的 定向 Cstream's orientation). Zi 
定 了 所 读 、 写 的 字符 是 单字 节 还 是 多 字 节 的 。 当 一 个 流 最 初 被 创建 时 ， 它 并 没有 定向 。 如 若 在 未 
定向 的 流 上 使 用 一 个 多 字 节 VO 函数 〈 见 <wchar.h>)， 则 将 该 流 的 定向 设置 为 宽 定向 的 。 若 在 
未 定向 的 流 上 使 用 一 个 单字 节 IO 函数 ， 则 将 该 流 的 定向 设 为 字 节 定 向 的 。 只 有 两 个 函数 可 改变 
流 的 定向 。freopen AM 〈 稍 后 讨论 ) 清除 一 个 流 的 定向 ，fwide 函数 可 用 于 设置 流 的 定向 。 

#include <stdio.h> 


#include <wchar.h> 


int fwide(FILE *fp, int mode); 
返回 值 : 若 流 是 宽 定向 的 ， 返 回 正 值 ; 车流 是 字 节 定向 的 ， 返 回 负 值 ; 若 流 是 未 定向 的 ， 返 回 0 
根据 mode 参数 的 不 同 值 ，fwi de 函数 执行 不 同 的 工作 。 
e Witt mode 参数 值 为 负 ，fwide 将 试图 使 指定 的 流 是 字 节 定向 的 。 
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e 如 若 mode 参数 值 为 正 ，fwide 将 试图 使 指定 的 流 是 宽 定向 的 。 

。 如 若 mode 参数 值 为 0，fwide 将 不 试图 设置 流 的 定向 ， 但 返回 标识 该 流 定向 的 值 。 

注意 ，fwide 并 不 改变 已 定向 流 的 定向 。 还 应 注意 的 是 ，fwide 无 出 错 返回 。 试 想 ， 如 若 
流 是 无 效 的 ， 那 么 将 发 生 什 么 呢 ? 我 们 唯一 可 依靠 的 是 ， 在 调用 fwide 前 先 清除 errno, M 
fwide 返回 时 检查 errno 的 值 。 在 本 书 的 其 余部 分 ， 我们 只 涉及 字 节 定向 流 。 

当 打开 一 个 流 时 ， 标 准 IO 函数 fopen (参考 5.5 节 ) 返回 一 个 指向 FILE 对 象 的 指针 。 该 对 
象 通常 是 一 个 结构 ， 它 包含 了 标准 IO 库 为 管理 该 流 需 要 的 所 有 信息 ， 包 括 用 于 实际 VO 的 文件 描 
述 符 、 指 向 用 于 该 流 缓冲 区 的 指针 、 缓 冲 区 的 长 度 、 当 前 在 缓冲 区 中 的 字符 数 以 及 出 错 标志 等 。 

应 用 程序 没有 必要 检验 FILE 对 象 。 为 了 引用 一 个 流 ， 需 将 PILE 指针 作为 参数 传递 给 每 个 
标准 VO 函数 。 在 本 书 中 ， 我 们 称 指 向 PILE 对 象 的 指针 (类 型 为 FILE*) 为 文件 指针 。 

在 本 章 中 ， 我 们 在 UNIX 系统 环境 中 说 明 标 准 VO 库 。 正 如 前 述 ， 此 标准 库 已 移植 到 UNIX 之 

外 的 很 多 系统 中 。 但 是 为 了 说 明 该 库 实 现 的 一 些 细节 ， 我 们 将 讨论 其 在 UNIX 系统 上 的 典型 实现 。 


5.3 ”标准 输入 、 标 准 输出 和 标准 错误 


对 一 个 进程 预定 义 了 3 个 流 ， 并且 这 3 个 流 可 以 自动 地 被 进程 使 用 ， 它 们 是 : 标准 输入 、 标 准 输出 
和 标准 错误 。 这 些 流 引 用 的 文件 与 在 3.2 节 中 提 到 文件 描述 符 STDIN FILENO. STDOUT FILENO 和 
STDERR_FILENO 所 引用 的 相同 。 

这 3 个 标准 VO 流通 过 预定 义 文件 指针 stdin. stdout 和 stderr 加 以 引用 。 这 3 个 文件 
指针 定义 在 头 文件 <stdio .h> 中 。 


5.4 缓冲 


标准 VO 库 提 供 缓冲 的 目的 是 尽 可 能 减少 使 用 read 和 write 调用 的 次 数 〈 见 图 3-6， 其 中 
显示 了 在 不 同 缓冲 区 长 度 情况 下 ， 执 行 VO 所 需 的 CPU 时 间 量 )。 它 也 对 每 个 IO 流 自动 地 进行 
缓冲 管理 ， 从 而 避免 了 应 用 程序 需要 考虑 这 一 点 所 带 来 的 麻烦 。 遗 憾 的 是 ， 标 准 VO 库 最 令 人 迷 
惑 的 也 是 它 的 缓冲 。 

标准 VO 提供 了 以 下 3 种 类 型 的 缓冲 。 

(OD 全 缓冲 。 在 这 种 情况 下 ， 在 填 满 标准 VO 缓冲 区 后 才 进 行 实际 VO 操作 。 对 于 驻 留 在 磁 
盘 上 的 文件 通常 是 由 标准 IO 库 实施 全 缓冲 的 。 在 一 个 流 上 执行 第 一 次 VO 操作 时 ， 相 关 标 准 UO 
函数 通常 调用 malloc (JL 7.8 节 ) 获得 需 使 用 的 缓冲 区 。 

术语 冲洗 (flush) 说 明 标 准 VO 缓冲 区 的 写 操作 。 缓 冲 区 可 由 标准 VO 例 程 自动 地 冲洗 〈 例 
如 ， 当 填 满 一 个 缓冲 区 时 )， 或 者 可 以 调用 函数 fflush 冲洗 一 个 流 。 值 得 注意 的 是 ， 在 UNIX 
环境 中 ，flush 有 两 种 意思 。 在 标准 IO 库 方面 ，flush (冲洗 ) 意味 着 将 缓冲 区 中 的 内 容 写 到 磁盘 
上 (该 缓冲 区 可 能 只 是 部 分 填 满 的 )。 在 终端 驱动 程序 方面 (例如 ， 在 第 18 章 中 所 述 的 tcflush 
RO, flush ANE) 表示 丢弃 已 存储 在 缓冲 区 中 的 数据 。 

(2) 行 缓冲 。 在 这 种 情况 下 ， 当 在 输入 和 输出 中 遇 到 换行 符 时 ， 标 准 UO 库 执行 VO 操作 。 
这 允许 我 们 一 次 输出 一 个 字符 (用 标准 IO 函数 fputc), 但 只 有 在 写 了 一 行 之 后 才 进 行 实际 VO 
操作 。 当 流 涉 及 一 个 终端 时 (如 标准 输入 和 标准 输出 )， 通 常 使 用 行 缓冲 。 

对 于 行 缓冲 有 两 个 限制 。 第 一 ， 因 为 标准 IO 库 用 来 收集 每 一 行 的 缓冲 区 的 长 度 是 固定 的 ， 
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所 以 只 要 填 满 了 缓冲 区 ， 那 么 即使 还 没有 写 一 个 换行 符 ， 也 进行 IO 操作 。 第 二 ， 任 何 时 候 只 要 
通过 标准 IO 库 要 求 从 (a) 一 个 不 带 缓 冲 的 流 ， 或 者 (b) 一 个 行 缓冲 的 流 〈 它 从 内 核 请 求 需要 [145] 
数据 》 得 到 输入 数据 ， 那 么 就 会 冲洗 所 有 行 缓冲 输出 流 。 在 〈(b》 中 带 了 一 个 在 括号 中 的 说 明 ， 
其 理由 是 ， 所 需 的 数据 可 能 已 在 该 缓冲 区 中 ， 它 并 不 要 求 一 定 从 内 核 读数 据 。 很 明显 ， 从 一 个 不 
带 缓冲 的 流 中 输入 〈 即 (a) 项 ) 需要 从 内 核 获得 数据 。 

(3) 不 带 缓冲 。 标 准 VO 库 不 对 字符 进行 缓冲 存储 。 例 如 ， 若 用 标准 VO 函数 fputs 写 15 
个 字符 到 不 带 缓冲 的 流 中 ， 我 们 就 期 望 这 15 个 字符 能 立即 输出 ， 很 可 能 使 用 3.8 节 的 write K 
数 将 这 些 字符 写 到 相关 联 的 打开 文件 中 。 

标准 错误 流 stderr 通常 是 不 带 缓冲 的 ， 这 就 使 得 出 错 信息 可 以 尽快 显示 出 来 ， 而 不 管 它们 
是 否 含有 一 个 换行 符 。 

ISO C 要 求 下 列 缓冲 特征 。 

。 当 且 仅 当 标准 输入 和 标准 输出 并 不 指向 交互 式 设备 时 ， 它 们 才 是 全 缓冲 的 。 

。 标准 错误 决 不 会 是 全 缓冲 的 。 

但 是 ， 这 并 没有 告诉 我 们 如 果 标 准 输入 和 标准 输出 指向 交互 式 设 备 时 ， 它 们 是 不 带 缓冲 的 还 
是 行 缓冲 的 ;以 及 标准 错误 是 不 带 缓冲 的 还 是 行 缓冲 的 。 很 多 系统 默认 使 用 下 列 类 型 的 缓冲 ; 

。 标准 错误 是 不 带 缓冲 的 。 

。 若是 指向 终端 设备 的 流 ， 则 是 行 缓冲 的 ， 否 则 是 全 缓冲 的 。 

本 书 讨论 的 4 种 平台 都 遵从 标准 VO 缓冲 的 这 些 惯例 ， 标 准 错误 是 不 带 缓冲 的 ， 打 开 至 终端 
设备 的 流 是 行 缓冲 的 ， 其 他 流 是 全 缓冲 的 。 


我 们 将 在 5.12 节 和 图 5-1 对 标准 VO 缓冲 做 更 详细 的 说 明 。 
对 任何 一 个 给 定 的 流 ， 如 果 我 们 并 不 喜欢 这 些 系统 默认 ， 则 可 调用 下 列 两 个 函数 中 的 一 个 更 
改 缓冲 类 型 。 


#include <stdio.h> 








void setbuf(FILE *restrict fp, char *restrict buf); 


int setvbuf(FILE *restrict fp, char *restrict buf, int mode, size_t size); 
返回 值 : FRH., RIO; 若 出 错 ， 返 回 非 0 


这 些 函 数 一 定 要 在 流 已 被 打开 后 调用 〈 这 是 十 分 明显 的 ， 因 为 每 个 函数 都 要 求 一 个 有 效 的 文 
件 指针 作为 它们 的 第 一 个 参数 )， 而 且 也 应 在 对 该 流 执行 任何 一 个 其 他 操作 之 前 调用 。 [146] 

可 以 使 用 setbuf 函数 打开 或 关闭 缓冲 机 制 。 为 了 带 缓冲 进行 VO, BR buf 必须 指向 一 个 
长 度 为 BUFSIZ 的 缓冲 区 (该 常量 定义 在 <stdio.h> 中 )。 通 常 在 此 之 后 该 流 就 是 全 缓冲 的 ， 但 
是 如 果 该 流 与 一 个 终端 设备 相关 ， 那么 某 些 系统 也 可 将 其 设置 为 行 缓冲 的 。 为 了 关闭 缓冲 , 将 buf 
设置 为 NULL。 

使 用 setvbuf， 我 们 可 以 精确 地 说 明 所 需 的 缓冲 类 型 。 这 是 用 mode 参数 实现 的 : 

_IOFBF 全 缓冲 

_IOLBF 行 缓冲 

_IONBF 不 带 缓冲 

如 果 指 定 一 个 不 带 缓 冲 的 流 ， 则 忽略 buf 和 size 参数 。 如 果 指 定 全 缓冲 或 行 缓冲 ， 则 buf 和 
size 可 选择 地 指定 一 个 缓冲 区 及 其 长 度 。 如 果 该 流 是 带 缓冲 的 ， 而 buf 是 NULL， 则 标准 LO 库 将 
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自动 地 为 该 流 分 配 适 当 长 度 的 缓冲 区 。 适 当 长 度 指 的 是 由 常量 BUFSIZ 所 指定 的 值 。 
某 些 C 函数 库 实现 使 用 stat 结构 中 的 成 员 st_blksize 所 指定 的 值 ( 见 4.2 节 ) 决定 最 佳 
LO 缓冲 区 长 度 。 在 本 章 的 后 续 内 容 中 可 以 看 到 ，GNU C 函数 库 就 使 用 这 种 方法 。 
图 5-1 列 出 了 这 两 个 函数 的 动作 ， 以 及 它们 的 各 个 选项 。 


a mem em 











图 5-1 setbuf 和 setvbuf 函数 
要 了 解 ， 如 果 在 一 个 函数 内 分 配 一 个 自动 变量 类 的 标准 VO 缓冲 区 ， 则 从 该 函数 返回 之 前 ， 
必须 关闭 该 流 〈7.8 节 将 对 此 做 更 多 讨论 )。 另 外 ， 其 些 实现 将 缓冲 区 的 一 部 分 用 于 存放 它 自己 的 
管理 操作 信息 ， 所 以 可 以 存放 在 缓冲 区 中 的 实际 数据 字 节 数 少 于 size。 一 般 而 言 ， 应 由 系统 选择 
缓冲 区 的 长 度 ， 并 自动 分 配 缓冲 区 。 在 这 种 情况 下 关闭 此 流 时 ， 标 准 IO 库 将 自动 释放 缓冲 区 。 
任何 时 候 ， 我 们 都 可 强制 冲洗 一 个 流 。 


#include<stdio.h> 


int fflush(FILE *fp); 





返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 EOF 


此 函数 使 该 流 所 有 未 写 的 数据 都 被 传送 至 内 核 。 作 为 一 种 特殊 情形 ， 如 若 力 是 NULL， 则 此 
函数 将 导致 所 有 输出 流 被 冲洗 。 


5.5 打开 流 


下 列 3 个 函数 打开 一 个 标准 VO 流 。 
#include <stdio.h> 


FILE *fopen(const char *restrict pathname, const char *restrict type); 


FILE *freopen(const char *restrict pathname, const char *restrict type, FILE *restrict fp); 


FILE *fdopen(int fd, const char *type); 
3 个 函数 的 返回 值 : 车 成 功 ， 返 回 文件 指针 ;车 出 错 ， 返 回 NULL 





这 3 个 函数 的 区 别 如 下 。 

(1) fopen 函数 打开 路 径 名 为 pathname 的 一 个 指定 的 文件 。 

(2) freopen 函数 在 一 个 指定 的 流 上 打开 一 个 指定 的 文件 ， 如 若 该 流 已 经 打开 ， 则 先 关 闭 该 
流 。 若 该 流 已 经 定向 ， 则 使 用 freopen 清除 该 定向 。 此 函数 一 般 用 于 将 一 个 指定 的 文件 打开 为 
一 个 预定 义 的 流 : 标准 输入 、 标 准 输出 或 标准 错误 。 

(3) fdopen 函数 取 一 个 已 有 的 文件 描述 符 (我 们 可 能 从 open. dup. dup2. fcntl. pipe. 
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socket, socketpair EK accept 函数 得 到 此 文件 描述 符 )， 并 使 一 个 标准 的 VO 流 与 该 描述 符 
相 结 合 。 此 函数 常用 于 由 创建 管道 和 网 络 通信 通道 函数 返回 的 描述 符 。 因 为 这 些 特殊 类 型 的 文件 
不 能 用 标准 IO 函数 fopen 打开 , 所 以 我 们 必须 先 调 用 设备 专用 函数 以 获得 一 个 文件 描述 符 ， 然 
后 用 £dopen 使 一 个 标准 VO 流 与 该 描述 符 相 结合 。 
fopen 和 freopen X ISO C 的 所 属 部 分 。 而 ISO C 并 不 涉及 文件 描述 符 , 所 以 仅 有 POSIX.1 
具有 fdopen。 : 


type 参数 指定 对 该 IO 流 的 读 、 写 方式 ,ISO C 规定 type 参数 可 以 有 15 种 不 同 的 值 ， 如 图 5-2 所 示 。 


open(2) 标 志 


r EÈ rb 为 读 而 打开 O_RDONLY 
w Bk, wb 把 文件 截断 至 0 长 ， 或 为 写 而 创建 O WRONLY|O CREAT|O TRUNC 


a 或 ab 追加 ; 为 在 文件 尾 写 而 打开 ,或 为 写 而 创建 O_WRONLY |O_CREAT |O_APPEND 
r+ 或 rtb 或 rb+ | 为 读 和 写 而 打开 O_RDWR 

w+ 或 wtb 或 wb+ | 把 文件 截断 至 0 长 ， 或 为 读 和 写 而 打开 O RDWR|O CREAT|O TRUNC 
a+ 或 a+b 或 ab+ | 为 在 文件 尾 读 和 写 而 打开 或 创建 O RDWR|O CREAT|O APPEND 





图 5-2 ”打开 标准 IO 流 的 type 参数 

使 用 字符 b 作为 type 的 一 部 分 , 这 使 得 标准 VO 系统 可 以 区 分 文本 文件 和 二 进 制 文件 。 因 为 UNIX 内 
核 并 不 对 这 两 种 文件 进行 区 分 ， 所 以 在 UNIX 系统 环境 下 指定 字符 b TEN type 的 一 部 分 实际 上 并 无 作用 。 

对 于 fdopen, type 参数 的 意义 稍 有 区 别 。 因 为 该 描述 符 已 被 打开 ， 所 以 fdopen 为 写 而 打开 并 
不 截断 该 文件 。( 例 如 , 若 该 描述 符 原 来 是 由 open 函数 创建 的 , 而 且 该 文件 已 经 存在 , 则 其 o_TRUNC 
标志 将 决定 是 否 截 断 该 文件 。fdopen 函数 不 能 截断 它 为 写 而 打开 的 任 一 文件 。) 另外 , 标准 VO 追加 
写 方式 也 不 能 用 于 创建 该 文件 〈 因 为 如 果 一 个 描述 符 引用 一 个 文件 ， 则 该 文件 一 定 已 经 存在 )。 

当 用 追加 写 类 型 打开 一 个 文件 后 ， 每 次 写 都 将 数据 写 到 文件 的 当前 尾 端 处 。 如 果 有 多 个 进程 
用 标准 VO 追加 写 方式 打开 同一 文件 ， 那 么 来 自 每 个 进程 的 数据 都 将 正确 地 写 到 文件 中 。 


4.4BSD 以 前 的 伯克利 版 本 以 及 Kemighan 和 Ritchie[1988] 第 177 页 上 所 示 的 简单 版 本 的 fopen 函 
数 并 不 能 正确 地 处 理 追 加 写 方式 。 这 些 版 本 在 打开 流 时 , 调用 lseek 定位 到 文件 尾 端 。 在 涉及 多 个 进程 
时 ， 为 了 正确 地 支持 追加 写 方式 ,该 文件 必须 用 O APPEND 标志 打开 ,我 们 已 在 3.3 节 中 对 此 进行 了 讨 
论 。 在 每 次 写 前 ,做 一 次 1seek 操作 同样 也 不 能 正确 工作 ( 如 同 在 3.11 节 中 讨论 的 一 样 ), 


当 以 读 和 写 类 型 打开 一 个 文件 时 (type 中 + 号 )， 具 有 下 列 限 制 。 

e 如 果 中 间 没 有 fflush、fseek、fsetpos RM rewind, 则 在 输出 的 后 面 不 能 直接 跟随 输入 。 

e 如果 中 间 没 有 fseek, fsetpos 或 rewind， 或 者 一 个 输入 操作 没有 到 达 文 件 尾 端 ， 则 
在 输入 操作 之 后 不 能 直接 跟随 输出 。 

对 应 于 图 5-2, K 5-3 中 列 出 了 打开 一 个 流 的 6 种 不 同 的 方式 。 


文件 必须 已 存在 
放弃 文件 以 前 的 内 容 


流 可 以 读 
流 可 以 写 
流 只 可 在 尾 端 处 写 


5-3 ”打开 一 个 标准 VO 流 的 6 种 不 同方 式 
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注意 ， 在 指定 w 或 a 类 型 创建 一 个 新 文件 时 ， 我 们 无 法 说 明 该 文件 的 访问 权限 位 〈 第 3 章 中 所 
述 的 open 函数 和 creat 函数 则 能 做 到 这 一 点 )。POSIX.1 要 求实 现 使 用 如 下 的 权限 位 集 来 创建 文件 ， 


S_IRUSR | S_IWUSR | S_IRGRP | S_IWGRP | S_IROTH | S_IWOTH 


回忆 4.8 节 ， 我 们 可 以 通过 调整 umask 值 来 限制 这 些 权限 。 
除非 流 引 用 终端 设备 ， 否 则 按 系 统 默认 ， 流 被 打开 时 是 全 缓冲 的 。 若 流 引 用 终端 设备 ， 则 该 
流 是 行 缓冲 的 。 一 旦 打开 了 流 ， 那 么 在 对 该 流 执行 任何 操作 之 前 ， 如 果 希 望 ， 则 可 使 用 前 节 所 述 
的 setbuf 和 setvbuf 改变 缓冲 的 类 型 。 
调用 fclose 关闭 一 个 打开 的 流 。 


#include <stdio.h> 


int fclose(FILE *fp); 





返回 值 : 车 成 功 ， 返 回 0; FHH, BE EOF 


在 该 文件 被 关闭 之 前 ， 冲 洗 缓冲 中 的 输出 数据 。 缓 冲 区 中 的 任何 输入 数据 被 丢弃 。 如 果 标 准 
VO 库 已 经 为 该 流 自 动 分 配 了 一 个 缓冲 区 ， 则 释放 此 缓冲 区 。 

当 一 个 进程 正常 终止 时 (直接 调用 exit 函数 , 或 从 main 函数 返回 )， 则 所 有 带 未 写 缓冲 数 
据 的 标准 VO 流 都 被 冲洗 ， 所 有 打开 的 标准 VO 流 都 被 关闭 。 


5.6 ” 读 和 写 流 


一 旦 打开 了 流 ， 则 可 在 3 种 不 同类 型 的 非 格式 化 VO 中 进行 选择 ， 对 其 进行 读 、 写 操作 。 

CD 每 次 一 个 字符 的 IJO。 一 次 读 或 写 一 个 字符 ， 如 果 流 是 带 缓冲 的 ， 则 标准 VO 函数 处 理 所 有 缓冲 。 

(2) 每 次 一 行 的 JO。 如 果 想 要 一 次 读 或 写 一 行 ， 则 使 用 fgets 和 fputs。 每 行 都 以 一 个 换 
行 符 终止 。 当 调用 fgets 时 ， 应 说 明 能 处 理 的 最 大 行 长 。5.7 节 将 说 明 这 两 个 函数 。 

(3) 直接 VO. fread 和 fwrite 函数 支持 这 种 类 型 的 IO。 每 次 VO 操作 读 或 写 某 种 数量 的 
对 象 ， 而 每 个 对 象 具有 指定 的 长 度 。 这 两 个 函数 常用 于 从 二 进 制 文件 中 每 次 读 或 写 一 个 结构 。5.9 
节 将 说 明 这 两 个 函数 。 

H# VO (direct /O) 这 个 术语 来 自 1SO C 标准 ， 有 时 也 被 称 为 : 二 进 制 JO、 一 次 一 个 对 象 
IO、 面 向 记录 的 VO 或 面向 结构 的 1/10。 不 要 把 这 个 特性 和 FreeBSD 和 Linux 支持 的 open 函数 
的 O_DIRECT 标志 混淆 ， 它 们 之 间 是 没有 关系 的 。 

(5.11 节 说 明了 格式 化 IO 函数， 如 printf 和 scanf.) 

1. 输入 函数 

以 下 3 个 函数 可 用 于 一 次 读 一 个 字符 。 

#include <stdio.h> 


int getc(FILE *fp); 


int fgetc(FILE *fp); 


int getchar(void); 





3 个 函数 的 返回 值 : 若 成 功 ， 返 回 下 一 个 字符 ; 若 已 到 达 文 件 尾 端 或 出 错 ， 返 回 EOF 
函数 getchar 等 同 于 getc (stdin) 。 前 两 个 函数 的 区 别 是 ，getc 可 被 实现 为 宏 ， 而 fgetc 
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不 能 实现 为 宏 。 这 意味 着 以 下 几 点 。 

(OD getc 的 参数 不 应 当 是 具有 副作用 的 表达 式 ， 因 为 它 可 能 会 被 计算 多 次 。 

(2) 因为 fgetc 一 定 是 个 函数 ， 所 以 可 以 得 到 其 地 址 。 这 就 允许 将 fgetc 的 地 址 作为 一 个 
参数 传送 给 另 一 个 函数 。 

(3) 调用 fgetc 所 需 时 间 很 可 能 比 调用 getc 要 长 ， 因 为 调用 函数 所 需 的 时 间 通 常 长 于 调用 宏 。 

这 3 个 函数 在 返回 下 一 个 字符 时 ， 将 其 unsigned char 类 型 转换 为 int 类 型 。 说 明 为 无 
符号 的 理由 是 ， 如 果 最 高 位 为 1 也 不 会 使 返回 值 为 负 。 要 求 整 型 返回 值 的 理由 是 ， 这 样 就 可 以 返 
回 所 有 可 能 的 字符 值 再 加 上 一 个 已 出 错 或 已 到 达 文 件 尾 端的 指示 值 . 在 <stdio.h> 中 的 常量 EOF 
被 要 求 是 一 个 负 值 ， 其 值 经 常 是 -1。 这 就 意味 着 不 能 将 这 3 个 函数 的 返回 值 存 放 在 一 个 字符 变量 
中 ， 以 后 还 要 将 这 些 函数 的 返回 值 与 常量 EoF 比较 。 

注意 ， 不 管 是 出 错 还 是 到 达 文 件 尾 端 ， 这 3 个 函数 都 返回 同样 的 值 。 为 了 区 分 这 两 种 不 同 的 
情况 ， 必 须 调 用 ferror 或 feof. 


#include <stdio.h> 





int ferror(FILE *fp); 


int feof(FILE *fp); 
两 个 函数 返回 值 : 若 条 件 为 真 ， 返 回 非 0〈 真 ); 否则 ， 返 回 0 (fO 





void clearerr(FILE *fp); 


在 大 多 数 实 现 中 ， 为 每 个 流 在 FILE 对 象 中 维护 了 两 个 标志 : 

. 出 错 标志 ; 

。 文件 结束 标志 。 

调用 clearerr 可 以 清除 这 两 个 标志 。 

从 流 中 读 取 数 据 以 后 ， 可 以 调用 ungetc 将 字符 再 压 送 回 流 中 。 


#include <stdio.h> 


int ungetc(int c, FILE *fp); 


返回 值 ; 若 成 功 ， 返 回 c， 若 出 错 ， 返 回 EOF 
压 送 回 到 流 中 的 字符 以 后 又 可 从 流 中 读 出 ， 但 读 出 字符 的 顺序 与 压 送 回 的 顺序 相反 。 应 当 了 
解 ， 虽 然 ISO C 允许 实现 支持 任何 次 数 的 回 送 ， 但 是 它 要 求实 现 提供 一 次 只 回 送 一 个 字符 。 我 们 
不 能 期 望 一 次 能 回 送 多 个 字符 。 [151] 
回 送 的 字符 ,不 一 定 必 须 是 上 一 次 读 到 的 字符 。 不 能 回 送 EOF. 但 是 当 已 经 到 达 文 件 尾 端 时 ， 
仍 可 以 回 送 一 个 字符 。 下 次 读 将 返回 该 字符 ， 再 读 则 返回 EoF。 之 所 以 能 这 样 做 的 原因 是 ， 一 次 
成 功 的 ungetc 调用 会 清除 该 流 的 文件 结束 标志 。 
当 正 在 读 一 个 输入 流 , 并 进行 某 种 形式 的 切 词 或 记号 切 分 操作 时 , 会 经 常用 到 回 送 字符 操作 。 
有 时 需要 先 看 一 看 下 一 个 字符 ， 以 决定 如 何 处 理 当 前 字符 。 然 后 就 需要 方便 地 将 刚 查看 的 字符 回 
送 ， 以 便 下 一 次 调用 getc 时 返回 该 字符 。 如 果 标 准 IO 库 不 提供 回 送 能 力 ， 就 需 将 该 字符 存放 
到 一 个 我 们 自己 的 变量 中 ， 并 设置 一 个 标志 以 便 判 别 在 下 一 次 需要 一 个 字符 时 是 调用 getc， 还 
是 从 我 们 自己 的 变量 中 取 用 这 个 字符 。 
用 ungetc 压 送 回 字 符 时 , 并 没有 将 它们 写 到 底层 文件 中 或 设备 上 , 只 是 将 它们 写 回 标准 IO 
库 的 流 缓冲 区 中 。 
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2. 输出 函数 
对 应 于 上 面 所 述 的 每 个 输入 函数 都 有 一 个 输出 函数 。 


#include <stdio.h> 


int putc(int c, FILE *fp); 


int fputc(int c, FILE *fp); 


int putchar(int c); 


3 个 函数 返回 值 : AR, lc; 若 出 错 ， 返 回 EOF 


与 输入 函数 一 样 , putchar (c) 等 同 于 putc(c，stdout), pute 可 被 实现 为 宏 , 而 fputc 
不 能 实现 为 宏 。 


5.7 每 次 一 行 |/O 


下 面 两 个 函数 提供 每 次 输入 一 行 的 功能 。 


#include <stdio.h> 





char *fgets(char *restrict buf, int n, FILE *restrict fp); 


char *gets(char *buf); 





两 个 函数 返回 值 : 若 成 功 ， 返 回 buf, 若 已 到 达 文 件 尾 端 或 出 错 ， 返 回 NULL 


这 两 个 函数 都 指定 了 缓冲 区 的 地 址 ， 读 入 的 行将 送 入 其 中 。gets 从 标准 输入 读 ， 而 fgets 
则 从 指定 的 流 读 。 
对 于 fgets， 必 须 指 定 缓冲 的 长 度 za。 此 函数 一 直 读 到 下 一 个 换行 符 为 止 ， 但 是 不 超过 n-1 
个 字符 ， 读 入 的 字符 被 送 入 缓冲 区 。 该 缓冲 区 以 null 字 节 结尾 。 如 若 该 行 包 括 最 后 一 个 换行 符 的 
字符 数 超过 n-1, 则 fgets 只 返回 一 个 不 完整 的 行 , 但 是 , 缓冲 区 总 是 以 null 字 节 结尾 .对 fgets 
的 下 一 次 调用 会 继续 读 该 行 。 
gets 是 一 个 不 推荐 使 用 的 函数 。 其 问题 是 调用 者 在 使 用 gets 时 不 能 指定 缓冲 区 的 长 度 。 
这 样 就 可 能 造成 缓冲 区 溢出 (如 若 该 行 长 于 缓冲 区 长 度 )， 写 到 缓冲 区 之 后 的 存储 空间 中 ， 从 而 
产生 不 可 预料 的 后 果 。 这 种 缺陷 曾 被 利用 ， 造 成 1988 年 的 因特网 蠕虫 事件 。 有 关 说 明 请 见 1989 
年 6 月 的 Communications of the ACM (vol.32,no.6)。gets 与 fgets 的 另 一 个 区 别 是 ，gets 并 
不 将 换行 符 存 入 缓冲 区 中 。 
这 两 个 函数 对 换行 符 处 理 方式 的 差别 与 UNIX 的 进展 有 关 。 在 V7 的 手册 ( 1979 ) 中 就 说 明 : 
“为 了 向 后 兼容 ，gets 删除 换行 符 ， 而 fgets 则 保留 换行 符 。 


虽然 ISO C 要 求 提 供 gets， 但 请 使 用 fgets， 而 不 要 使 用 gets。 事 实 上， 在 SUSv4 tF, 
gets 被 标记 为 弃 用 的 接口 ， 而 且 在 ISO C 标准 的 最 新 版 本 CISO/IEC 9899:2011) 中 已 被 忽略 。 
fputs 和 puts 提供 每 次 输出 一 行 的 功能 。 


#include <stdio.h> 





int fputs (const char *restrict sir, FILE *restrict fp); 





int puts(const char *str); 


两 个 函数 返回 值 : 若 成 功 ， 返 回 非 负 值 ， 若 出 错 ， 返 回 EOF 
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函数 fputs 将 一 个 以 null 字 节 终止 的 字符 串 写 到 指定 的 流 ， 尾 端的 终止 符 null 不 写 出 。 注 
意 ， 这 并 不 一 定 是 每 次 输出 一 行 ， 因 为 字符 串 不 需要 换行 符 作为 最 后 一 个 非 null 字 节 。 通 常 ， 在 
null 字 节 之 前 是 一 个 换行 符 ， 但 并 不 要 求 总 是 如 此 。 

puts 将 一 个 以 null 字 节 终止 的 字符 串 写 到 标准 输出 ,终止 符 不 写 出 。 但 是 ，puts 随后 又 将 
一 个 换行 符 写 到 标准 输出 。 

puts 并 不 像 它 所 对 应 的 gets 那样 不 安全 。 但 是 我 们 还 是 应 避免 使 用 它 ， 以 免 需要 记 住 它 
在 最 后 是 否 添加 了 一 个 换行 符 。 如 果 总 是 使 用 fgets 和 fputs, 那么 就 会 熟知 在 每 行 终止 处 我 
们 必须 自己 处 理 换 行 符 。 


5.8 标准 1/O 的 效率 


使 用 前 面 所 述 的 函数 ， 我 们 能 对 标准 VO 系统 的 效率 有 所 了 解 。 图 5-4 程序 类 似 于 图 3-4 FE 
序 ， 它 使 用 getc 和 putc 将 标准 输入 复制 到 标准 输出 。 这 两 个 例 程 可 以 实现 为 宏 。 153 


#include "apue.h" 


int 
main (void) 


{ 


int C; 
while ((c = getc(stdin)) != EOF) 
if (putc(c, stdout) == EOF) 


err sys("output error"); 


if (ferror(stdin)) 
err sys("input error"); 


exit(0); 


图 5-4 用 getc 和 putc 将 标准 输入 复制 到 标准 输出 
可 以 用 fgetc 和 £putc 改写 该 程序 ， 这 两 个 一 定 是 函数 ， 而 不 是 宏 〈 我 们 没有 给 出 对 源 代 
码 更 改 的 细节 )。 
最 后 ， 我 们 还 编写 了 一 个 读 、 写 行 的 版 本 ， 见 图 5-5. 


#include “apue.h" 


int 
main (void) 
{ 
char buf [MAXLINE] ; 


while (fgets(buf, MAXLINE, stdin) != NULL) 
if (fputs(buf, stdout) == EOF) 
err_sys("output error"); 


if (ferror(stdin) ) 
err_sys("input error"); 
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exit (0); 





图 5-5 用 fgets Al fputs 将 标准 输入 复制 到 标准 输出 
注意 ,在 图 5-4 程序 和 图 5-5 程序 中 , 没有 显 式 地 关闭 标准 VO 流 。 我 们 知道 exit 函数 将 会 
冲洗 任何 未 写 的 数据 ， 然 后 关闭 所 有 打开 的 流 (我 们 将 在 8.5 节 讨 论 这 一 点 )。 将 这 3 个 程序 的 时 
间 与 图 3-6 中 的 时 间 进 行 比较 是 很 有 趣 的 。 图 5-6 中 显示 了 对 同一 文件 (98.5 MB, 300 万 行 ) 进 
行 操作 所 得 的 数据 。 


| ”图 3-6 中 的 最 佳 时 间 | 
fgets、 fputs 
getc, pute 


fgetc. fputc 
图 3-6 中 的 单字 节 时 间 





5-6 ”使 用 标准 VO 例 程 得 到 的 时 间 结 果 

对 于 这 3 个 标准 VO 版 本 的 每 一 个 ， 其 用 户 CPU 时 间 都 大 于 图 3-6 中 的 最 佳 read mA, 
为 在 每 次 读 一 个 字符 的 标准 IO 版 本 中 有 一 个 要 执行 1 亿 次 的 循环 ， 而 在 每 次 读 一 行 的 版 本 中 有 
一 个 要 执行 3 144 984 次 的 循环 。 在 read 版 本 中 ， 其 循环 只 需 执行 25 224 次 (对 于 缓冲 区 长 度 
为 4096 字 节 )。 因 为 系统 CPU 时 间 几 乎 相同 ， 所 以 用 户 CPU 时 间 的 差别 以 及 等 待 UO 结束 所 消 
耗 时 间 的 差别 造成 了 时 钟 时 间 的 差别 。 

系统 CPU 时 间 几 乎 相同 , 原因 是 因为 所 有 这 些 程序 对 内 核 提 出 的 读 、 写 请 求 数 基本 相同 。 注 
意 ， 使 用 标准 VO 例 程 的 一 个 优点 是 无 需 考虑 缓冲 及 最 佳 VO 长 度 的 选择 。 在 使 用 fgets 时 需要 
考虑 最 大 行 长 ， 但 是 与 选择 最 佳 IO 长 度 比 较 ， 这 要 方便 得 多 。 

图 5-6 的 最 后 一 列 是 每 个 main 函数 的 文本 空间 字 节 数 (由 C 编译 器 产生 的 机 器 指令 )。 从 中 
可 见 , 使 用 getc All putc 的 版 本 与 使 用 fgetc 和 fputc 的 版 本 在 文本 空间 长 度 方面 大 体 相 同 。 
通常 ，getc 和 pute 实现 为 宏 ， 但 在 GNU C 库 实现 中 ， BRET ABSA. 

使 用 每 次 一 行 VO 版 本 的 速度 大 约 是 每 次 一 个 字符 版 本 速度 的 两 倍 。 如 果 fgets 和 fputs 
函数 是 用 getc 和 putc 实现 的 (参见 Kernighan 和 Ritchie[1988] 的 7.7 节 )， 那 么 ， 可 以 预期 fgets 
版 本 的 时 间 会 与 getc 版 本 接近 。 实 际 上 ， 每 次 一 行 的 版 本 会 更 慢 一 些 ， 因 为 除了 现 已 存在 的 6 
百 万 次 函数 调用 外 还 需 另 外 增加 2 亿 次 函数 调用 。 而 在 本 测试 中 所 用 的 每 次 一 行 函 数 是 用 
memccpy(3) 实 现 的 。 通 常 ， 为 了 提高 效率 ，memccpy 函数 用 汇编 语言 而 非 C 语言 编写 。 正 因为 
如 此 ， 每 次 一 行 版 本 才 会 有 较 高 的 速度 。 

这 些 时 间 数 字 的 最 后 一 个 有 趣 之 处 在 于 : fgetc 版 本 较 图 3-6 中 BUFFSIZE=1 的 版 本 要 快 
得 多 。 两 者 都 使 用 了 约 2 亿 次 的 函数 调用 ， 在 用 户 CPU 时 间 方 面 ，fgetc 版 本 的 速度 大 约 是 后 
者 的 16 倍 ， 而 在 时 钟 时 间 方 面 几 乎 是 39 倍 。 造 成 这 种 差别 的 原因 是 : 使 用 read 的 版 本 执行 了 
2 亿 次 函数 调用 ， 这 也 就 引起 2 亿 次 系统 调用 。 而 对 于 fgetc 版 本 ， 它 也 执行 2 亿 次 函数 调用 ， 
但 是 这 只 引起 25 224 次 系统 调用 。 系 统 调用 与 普通 的 函数 调用 相 比 需 要 花费 更 多 的 时 间 。 

需要 声明 的 是 , 这 些 时 间 结 果 只 在 某 些 系统 上 才 有 效 。 这 种 时 间 结 果 依 赖 于 很 多 实现 的 特征 ， 
而 这 种 特征 对 于 不 同 的 UNIX 系统 可 能 是 不 同 的 。 尽 管 如 此 ， 有 这 样 一 组 数据 ， 并 对 各 种 版 本 的 
差别 做 出 解释 ， 这 有 助 于 我 们 更 好 地 了 解 系统 。 在 本 节 及 3.9 节 中 我 们 了 解 到 的 基本 事实 是 ， 标 
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准 VO 库 与 直接 调用 read 和 write 函数 相 比 并 不 慢 很 多 。 对 于 大 多 数 比较 复杂 的 应 用 程序 ， 最 
主要 的 用 户 CPU 时 间 是 由 应 用 本 身 的 各 种 处 理 消 耗 的 ， 而 不 是 由 标准 VO 例 程 消耗 的 。 


5.9 二进制 I/O 


5.6 节 和 5.7 节 中 的 函数 以 一 次 一 个 字符 或 一 次 一 行 的 方式 进行 操作 。 如 果 进 行 二 进 制 UO BR 
作 ， 那 么 我 们 更 愿意 一 次 读 或 写 一 个 完整 的 结构 。 如 果 使 用 getc 或 putc 读 、 写 一 个 结构 ， 那 
么 必须 循环 通过 整个 结构 ， 每 次 循环 处 理 一 个 字 节 ， 一 次 读 或 写 一 个 字 节 ， 这 会 非常 麻烦 而 且 费 
时 。 如 果 使 用 fputs 和 fgets， 那 么 因为 fputs 在 遇 到 null 字 节 时 就 停止 ， 而 在 结构 中 可 能 含 
有 null 字 节 ， 所 以 不 能 使 用 它 实现 读 结构 的 要 求 。 相 类 似 ， 如 果 输 入 数据 中 包含 有 null 字 节 或 换 
行 符 ， 则 fgets 也 不 能 正确 工作 。 因 此 ， 提 供 了 下 列 两 个 函数 以 执行 二 进 制 IO 操作 。 


#include <stdio.h> 


size_t fread(void *restrict ptr, size_t size, size_t nobj, FILE *restrict Ip): 


size t fwrite(const void *restrict ptr, size_t size, size t nobj, FILE *restrict fp); 


两 个 函数 的 返回 值 ， 读 或 写 的 对 象 数 





这 些 函 数 有 以 下 两 种 常见 的 用 法 。 
(D 读 或 写 一 个 二 进 制 数组 。 例 如 ， 为 了 将 一 个 浮 点 数组 的 第 2 一 5 个 元 素 写 至 一 文件 上 ， 
可 以 编写 如 下 程序 : 


float data[10]; 


if (fwrite(&data[2], sizeof(float), 4, fp) != 4) 
err sys("fwrite error"); 


其 中 ， 指 定 size 为 每 个 数组 元 素 的 长 度 ，nobi 为 欲 写 的 元 素 个 数 。 
(2) 读 或 写 一 个 结构 。 例 如 ， 可 以 编写 如 下 程序 : 


struct { 
short count; 
long total; 
char name [NAMESIZE]; 
) item; 
if (fwrite(&item, sizeof(item), 1, fp) !- 1) 


err sys("fwrite error"); 


其 中 ， 指 定 size 为 结构 的 长 度 ，nobj H1 (要 写 的 对 象 个 数 )。 
将 这 两 个 例子 结合 起 来 就 可 读 或 写 一 个 结构 数组 。 为 了 做 到 这 一 点 ，size 应 当 是 该 结构 的 
sizeof, nobj 应 是 该 数组 中 的 元 素 个 数 。 
fread 和 fwrite 返回 读 或 写 的 对 象 数 。 对 于 读 ， 如 果 出 错 或 到 达 文 件 尾 端 ， 则 此 数字 可 以 
少 于 nobj。 在 这 种 情况 ， 应 调用 ferror 或 feof 以 判断 究竟 是 那 一 种 情况 。 对 于 写 ， 如 果 返 回 
值 少 于 所 要 求 的 nobjy， 则 出 错 。 
使 用 二 进 制 IO 的 基本 问题 是 ， 它 只 能 用 于 读 在 同一 系统 上 已 写 的 数据 。 多 年 之 前 ， 这 并 无 
问题 ( 那 时 ， 所 有 UNIX 系统 都 运行 于 PDP-11 上 )， 而 现在 ， 很 多 异 构 系 统 通过 网 络 相互 连接 起 
来 ， 而 且 ， 这 种 情况 已 经 非常 普遍 。 常 常 有 这 种 情形 ， 在 一 个 系统 上 写 的 数据 ， 要 在 另 一 个 系统 
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上 进行 处 理 。 在 这 种 环境 下 ， 这 两 个 函数 可 能 就 不 能 正常 工作 ， 其 原因 是 : 

CL) 在 一 个 结构 中 ， 同 一 成 员 的 偏 移 量 可 能 随 编 译 程序 和 系统 的 不 同 而 不 同 〈 由 于 不 同 的 对 
齐 要 求 )。 确 实 ， 某 些 编译 程序 有 一 个 选项 ， 选 择 它 的 不 同 值 ， 或 者 使 结构 中 的 各 成 员 紧 密 包装 
(这 可 以 节省 存储 空间 ， 而 运行 性 能 则 可 能 有 所 下 降 ); 或 者 准确 对 齐 〈 以 便 在 运行 时 易于 存 取 结 
构 中 的 各 成 员 )。 这 意味 着 即使 在 同一 个 系统 上 ， 一 个 结构 的 二 进 制 存放 方式 也 可 能 因 编 译 程序 
选项 的 不 同 而 不 同 。 

(2) 用 来 存储 多 字 节 整数 和 浮 点 值 的 二 进 制 格式 在 不 同 的 系统 结构 间 也 可 能 不 同 。 

在 第 16 章 讨论 套 接 字 时 ， 我 们 将 涉及 某 些 相关 问题 。 在 不 同系 统 之 间 交 换 二 进 制 数据 的 实 
际 解 决 方法 是 使 用 互 认 的 规范 格式 。 关 于 网 络 协议 使 用 的 交换 二 进 制 数据 的 某 些 技术 ， 请 参阅 
Rogo[1993] 的 8.2 节 或 者 Stevens. Fenner 和 Rudoff[2004]f 5.18 节 。 

在 8.14 节 中 ， 我 们 将 再 回 到 fread 函数 ， 那 时 将 用 它 读 一 个 二 进 制 结构 
会 计 记 录 。 


5.10 定位 流 


有 3 种 方法 定位 标准 IO 流 。 

(1) ftell 和 fseek 函数 。 这 两 个 函数 自 V7 以 来 就 存在 了 ， 但 是 它们 都 假定 文件 的 位 置 
可 以 存放 在 一 个 长 整 型 中 。 

(2) ftello 和 fseeko MM. Single UNIX Specification 引入 了 这 两 个 函数 ， 使 文件 偏 移 量 
可 以 不 必 一 定 使 用 长 整 型 。 它 们 使 用 off_t 数据 类 型 代替 了 长 整 型 。 

(3) fgetpos 和 fsetpos 函数 。 这 两 个 函数 是 由 ISO C 引入 的 。 它 们 使 用 一 个 抽象 数据 类 型 
fpos t 记录 文件 的 位 置 。 这 种 数据 类 型 可 以 根据 需要 定义 为 一 个 足够 大 的 数 ， 用 以 记录 文件 位 置 。 

需要 移植 到 非 UNIX 系统 上 运行 的 应 用 程序 应 当 使 用 £getpos 和 fsetpos. 


#include <stdio.h> 





UNIX 的 进程 


long ftell (FILE *fp); 
返回 值 : 车 成 功 ， 返 回 当前 文件 位 置 指示 ; 车 出 错 ， 返 回 -1L 


int fseek(FILE *fp, long offset, int whence) ; 


返回 值 ， 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 





void rewind(FILE *fp); 


对 于 一 个 二 进 制 文件 ， 其 文件 位 置 指示 器 是 从 文件 起 始 位 置 开 始 度量 ， 并 以 字 节 为 度量 单位 
i. ftell 用 于 二 进 制 文件 时 ， 其 返回 值 就 是 这 种 字 节 位 置 。 为 了 用 fseek 定位 一 个 二 进 制 文 
件 ， 必 须 指 定 一 个 字 节 ofset， 以 及 解释 这 种 偏 移 量 的 方式 。whence 的 值 与 3.6 节 中 Iseek 函数 的 
相同 : SEEK SET 表示 从 文件 的 起 始 位 置 开始 ，SEEK_CUR 表示 从 当前 文件 位 置 开 始 ，SEEK_END 
表示 从 文件 的 尾 端 开始 。ISO C 并 不 要 求 一 个 实现 对 二 进 制 文件 支持 SEEK END 规格 说 明 ， 其 原 
因 是 某 些 系统 要 求 二 进 制 文件 的 长 度 是 某 个 约 数 的 整数 倍 ， 结 尾 非 实际 内 容 部 分 则 填充 为 0。 但 
是 在 UNIX 中 ， 对 于 二 进 制 文件 ， 则 是 支持 SEEK_END 的 。 

对 于 文本 文件 ， 它 们 的 文件 当前 位 置 可 能 不 以 简单 的 字 节 偏 移 量 来 度量 。 这 主要 也 是 在 非 
UNIX 系统 中 ， 它 们 可 能 以 不 同 的 格式 存放 文本 文件 。 为 了 定位 一 个 文本 文件 ，whence 一 定 要 是 
SEEK_SET， 而 且 offset 只 能 有 两 种 值 : 0 后 退 到 文件 的 起 始 位 置 )， 或 是 对 该 文件 的 ftell 所 
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返回 的 值 。 使 用 rewind 函数 也 可 将 一 个 流 设 置 到 文件 的 起 始 位 置 。 
除了 偏 移 量 的 类 型 是 off tt 而 非 long 以 外 ，ftello 函数 与 ftell 相同 ，fseeko 函数 
与 fseek 相同 。 





#include <stdio.h> 


off_t ftello(FILE *fp); 


返回 值 : 若 成 功 ， 返 回 当前 文件 位 置 ; 若 出 错 ， 返 回 (off_t) -1 


int fseeko(FILE *fp, off t offset, int whence); 





返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 
回忆 3.6 节 中 对 ott c 数据 类 型 的 讨论 。 实 现 可 将 of f_t 类 型 定义 为 长 于 32 位 。 
正如 我 们 已 提 及 的 ，fgetpos 和 fsetpos 两 个 函数 是 ISO C 标准 引入 的 。 

#include <stdio.h> 
int fgetpos(FILE *restrict fp, fpos_t *restrict pos); 


int fsetpos(FILE *fp, const fpos_t *pos) ; 





两 个 函数 返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 非 0 


fgetpos 将 文件 位 置 指 示 器 的 当前 值 存 入 由 pos 指向 的 对 象 中 。 在 以 后 调用 fsetpos 时 ， 
可 以 使 用 此 值 将 流 重新 定位 至 该 位 置 。 


5.11 格式 化 I/O 


1. 格式 化 输出 
格式 化 输出 是 由 5 个 printf 函数 来 处 理 的 。 


#include <stdio.h> 
int printf(const char *restrict format, ...); 
int fprintf(FILE *restrict fp, const char *restrict format, ...); 
int dprintf(int fd, const char *restrict format, ...); 
3 个 函数 返回 值 ， 若 成 功 ， 返 回 输出 字符 数 ， 若 输出 出 错 ， 返 回 负 值 
int sprintf(char *restrict buf, const char *restrict format, ...); 


返回 值 : 若 成 功 ， 返 回 存 入 数组 的 字符 数 ， 若 编码 出 错 ， 返 回 负 值 


int snprintf(char *restrict buf, size t n, const char *restrict format, ...); 


返回 值 : 车 缓冲 区 足够 大 ， 返 回 将 要 存 入 数组 的 字符 数 ; 若 编码 出 错 ， 返 回 负 值 





printf 将 格式 化 数据 写 到 标准 输出 ，fprintf 写 至 指定 的 流 ，dprintf 写 至 指定 的 文件 
描述 符 ，sprintf 将 格式 化 的 字符 送 入 数组 buf 中 。sprintf 在 该 数组 的 尾 端 自动 加 一 个 null 
字 节 ， 但 该 字符 不 包括 在 返回 值 中 。 

JER, sprintf 函数 可 能 会 造成 由 buf 指 向 的 缓冲 区 的 溢出 。 调 用 者 有 责任 确保 该 缓冲 区 足 
够 大 。 因 为 缓冲 区 溢出 会 造成 程序 不 稳定 甚至 安全 隐患 ， 为 了 解决 这 种 缓冲 区 溢出 问题 ， 引 入 了 
snprintf 函数 。 在 该 函数 中 ， 缓 冲 区 长 度 是 一 个 显 式 参数 ， 超 过 缓冲 区 尾 端 写 的 所 有 字符 都 被 
丢弃。 如 果 缓 冲 区 足够 大 ，snprintf 函数 就 会 返回 写 入 缓冲 区 的 字符 数 。 与 sprintf 相同 ， 
该 返回 值 不 包括 结尾 的 null 字 节 。 4 snprintf 函数 返回 小 于 缓冲 区 长 度 n 的 正 值 , 那么 没有 截 
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断 输 出 。 若 发 生 了 一 个 编码 的 错误 ，snprintf 返回 负 值 。 
虽然 dprintf 不 处 理 文件 指针 ， 但 我 们 仍然 把 它 包括 在 处 理 格式 化 输出 的 函数 中 。 注 意 ， 
使 用 dprintf 不 需要 调用 fdopen 将 文件 描述 符 转换 为 文件 指针 (fprintf 需要 )。 
格式 说 明 控 制 其 余 参 数 如 何 编写 ， 以 后 又 如 何 显 示 。 每 个 参数 按照 转换 说 明 编 写 ， 转 换 说 明 
159! 以 百 分 号 % 开 始 ， 除 转换 说 明 外 ,格式 字符 串 中 的 其 他 字符 将 按 原样 ， 不 经 任何 修改 被 复制 输出 。 
一 个 转换 说 明 有 4 个 可 选择 的 部 分 ， 下 面 将 它们 都 示 于 方 插 号 中 : 


%[flags] [fldwidth] [precision] [lenmodifier]convtype 


图 5-7 总 结 了 各 种 标志 。 


CCS) 将 整数 按 千 位 分 组 字符 
在 字段 内 左 对 齐 输出 


总 是 显示 带 符号 转换 的 正 负 号 
如 果 第 一 个 字符 不 是 正 负 号 ， 则 在 其 前 面 加 上 一 个 空格 
指定 另 一 种 转换 形式 (例如 ， 对 于 十 六 进 制 格 式 ， 加 Ox BARD 
添加 前 导 0 而 非 空格 ) 进行 填充 
图 5-7 转换 说 明 中 的 标志 部 分 
fldwidth 说 明 最 小 字段 宽度 。 转换 后 参数 字符 数 若 小 于 宽度 , 则 多 余 字 符 位 置 用 空格 填充 。 
字段 宽度 是 一 个 非 负 十 进 制 数 ， 或 是 一 个 星 号 (*)。 
precision 说 明 整 型 转换 后 最 少 输出 数字 位 数 、 浮 点 数 转换 后 小 数 点 后 的 最 少 位 数 、 
字符 串 转 换 后 最 大 字 节 数 。 精 度 是 一 个 点 〈. )， 其 后 跟随 一 个 可 选 的 非 负 十 进 制 数 或 一 个 星 
Cs 
宽度 和 精度 字段 两 者 皆 可 为 *。 此 时 ， 一 个 整 型 参数 指定 宽度 或 精度 的 值 。 该 整 型 参数 正好 
位 于 被 转换 的 参数 之 前 。 
lenmodifier 说 明 参 数 长 度 。 其 可 能 的 值 示 于 图 5-8 中 。 





将 相应 的 参数 按 signed R unsigned char 类 型 输出 
将 相应 的 参数 按 signed 或 unsigned short 类 型 输出 
将 相应 的 参数 按 signed K unsigned long 或 宽 字 符 类 型 输出 


将 相应 的 参数 按 signed 或 unsigned long long 类 型 输出 


intmax 七 或 uintmax t 


size_t 
ptrdiff_t 
long double 


图 5-8 ”转换 说 明 中 的 长 度 修饰 符 
convtype 不 是 可 选 的 。 它 控制 如 何 解释 参数 。 图 5-9 中 列 出 了 各 种 转换 类 型 字符 。 
根据 常规 的 转换 说 明 ， 转 换 是 按照 它们 出 现在 format 参数 之 后 的 顺序 应 用 于 参数 的 。 一 
种 替代 的 转换 说 明 语 法 也 允许 显 式 地 用 %n8 序 列 来 表示 第 n 个 参数 的 形式 来 命名 参数 。 注 意 ， 
这 两 种 语法 不 能 在 同一 格式 说 明 中 混用 。 在 替代 的 语法 中 ， 参 数 从 1 开始 计数 。 如 果 参 数 既 
没有 提供 字段 宽度 和 也 没有 提供 精度 , 通配符 星 号 的 语法 就 更 改 为 *m8，m 指明 提供 值 的 参数 
的 位 置 。 
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有 符号 十 进 制 

无 符号 八进制 

无 符号 十 进 制 

无 符号 十 六 进 制 

双 精 度 浮 点 数 

指数 格式 双 精 度 浮 点 数 

根据 转换 后 的 值 解释 为 E、F、e 或 了 


十 六 进 制 指数 格式 双 精 度 浮 点 数 

字符 〈 若 带 长 度 修 饰 符 1， 为 宽 字 符 ) 

字符 串 〈 若 带 长 度 修饰 符 1， 为 宽 字 符 ) 

指向 void 的 指针 

到 目前 为 止 , 此 printf 调用 输出 的 字符 的 数目 将 被 写 入 到 
指针 所 指向 的 带 符号 整 型 中 

一 个 $ 字 符 

宽 字 符 (XSI 扩展 ， 等 效 于 lc) 

REAR XS FE, FAF 1s) 


图 5-9 ”转换 说 明 中 的 转换 类 型 
下 列 5 种 printf 族 的 变 体 类 似 于 上 面 的 S 种 ， 但 是 可 变 参 数 表 C...) 替换 成 了 arg。 


#include <stdarg.h> 





#include <stdio.h> 


vprintf (const char *restrict format, va_list arg); 


vfprintf(FILE *restrict fp, const char *restrict format, va_list arg); 


vdprintf(int fd, const char *restrict format, va list arg); 
所 有 3 个 函数 返回 值 : 若 成 功 ， 返 回 输 出 字符 数 ， 若 输出 出 错 ， 返 回 负 值 
vsprintf(char *restrict buf, const char *restrict format, va_list arg); 
函数 返回 值 : 若 成 功 ， 返 回 存 入 数组 的 字符 数 ， 若 编码 出 错 ， 返 回 负 值 
vsnprintf(char *restrict buf, size t n, const char *restrict format, va list arg); 


函数 返回 值 : 若 缓 神 区 足够 大 ， 返 回 存 入 数组 的 字符 数 ， 若 编码 出 错 ， 返 回 负 值 


在 附录 B 的 出 错 处 理 例 程 中 ， 将 使 用 vsnprintf 函数 。 

关于 ISO C 标 准 中 有 关 可 变 长 度 参 数 表 的 详细 说 明 请 参阅 Kernighan 和 Ritchie[1988] 的 7.3 节 。 
应 当 了 解 的 是 ， 由 ISO C 提供 的 可 变 长 度 参 数 表 例 程 (<stdarg .h> 头 文件 和 相关 的 例 程 ) 与 由 
较 早 版 本 UNIX 提供 的 <varargs .h> 例 程 是 不 同 的 。 

2. 格式 化 输入 

执行 格式 化 输入 处 理 的 是 3 个 scant 函数 。 


#include <stdio.h> 





int scanf(const char *restrict format, ...); 


int fscanf(FILE *restrict fp, const char *restrict format, ...); 


int sscanf(const char *restrict buf, const char *restrict format, ...); 


3 个 函数 返回 值 : 赋值 的 输入 项 数 ， 若 输入 出 错 或 在 任 一 转换 前 已 到 达 文件 尾 端 ， 返 回 EOF 
scant 族 用 于 分 析 输 入 字符 串 ， 并 将 字符 序列 转换 成 指定 类 型 的 变量 。 在 格式 之 后 的 各 参数 
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包含 了 变量 的 地 址 ， 用 转换 结果 对 这 些 变量 赋值 。 

格式 说 明 控制 如 何 转换 参数 ， 以 便 对 它们 赋值 。 转 换 说 明 以 8 字符 开始 。 除 转换 说 明和 空白 
字符 外 ， 格 式 字 符 串 中 的 其 他 字符 必须 与 输入 匹配 。 若 有 一 个 字符 不 匹配 ， 则 停止 后 续 处 理 ， 不 
再 读 输 入 的 其 余部 分 。 

一 个 转换 说 明 有 3 个 可 选择 的 部 分 ， 下 面 将 它们 都 示 于 方 括号 中 : 


%[*] [fldwidth] [m] [lenmodifier] convtype 


可 选择 的 星 号 CO 用 于 抑制 转换 。 按 照 转换 说 明 的 其 余部 分 对 输入 进行 转换 ， 但 转换 结果 并 不 
存放 在 参数 中 。 

fldwidth 说 明 最 大 宽度 ( 即 最 大 字符 数 )。lenmodifier 说 明 要 用 转换 结果 赋值 的 参数 大 小 。 
H printf 函数 族 支持 的 长 度 修饰 符 同 样 得 到 scant 族 函 数 的 支持 〈 见 图 5-8 中 的 长 度 修饰 符 表 )。 

convtype 字段 类 似 于 printf 族 的 转换 类 型 字段 ， 但 两 者 之 间 还 有 些 差别 。 一 个 差别 是 ， 
作为 一 种 选项 , 输入 中 带 符号 的 可 赋予 无 符号 类 型 。 例 如, 输入 流 中 的 -1 可 被 转换 成 4 294 967 295 
赋予 无 符号 整 型 变量 。 图 5-10 总 结 了 scanf 族 函 数 支 持 的 转换 类 型 。 

在 字段 宽度 和 长 度 修饰 符 之 间 的 可 选项 m 是 赋值 分 配 符 。 它 可 以 用 于 %$c、%s 以 及 % [转换 符 ， 

迫使 内 存 缓冲 区 分 配 空间 以 接纳 转换 字符 串 。 在 这 种 情况 下 ， 相 关 的 参数 必须 是 指针 地 址 ， 分 配 

的 缓冲 区 地 址 必须 复制 给 该 指针 。 如 果 调 用 成 功 ， 该 缓冲 区 不 再 使 用 时 ， 由 调用 者 负责 通过 调用 
free 函数 来 释放 该 缓冲 区 。 

scanf 函数 族 同 样 支持 另外 一 种 转换 说 明 ， 人 允许 显 式 地 命名 参数 : 序列 %n3 代 表 了 第 n E 
数 ,与 printf 函数 族 相同 , 同一 编号 的 参数 在 格式 串 中 可 引用 多 次 。 但 Single UNIX Specification 
指出 ， 这 种 情况 在 scant 函数 族 中 如 何 作 用 还 未 定义 。 


d 有 符号 十 进 制 ， 基 数 为 10 


i 有 符号 十 进 制 ， 基 数 由 输入 格式 决定 

o 无 符号 八进制 〈 输 入 可 选 地 有 符号 ) 

u 无 符号 十 进 制 ， 基 数 为 10( 输 入 可 选 地 有 符号 ) 

x. X 无 符号 十 六 进 制 〈 输 入 可 选 地 有 符号 ) 
a. A. e. BE. f. F.g. G | PAR 

字符 〈 若 带 长 度 修饰 符 1， 为 宽 字符 ) 
字符 串 ( 若 带 长 度 修饰 符 1， 为 宽 字 符 串 ) 
匹配 列 出 的 字符 序列 ， 以 ] 终止 
匹配 除 列 出 字符 以 外 的 所 有 字符 ， 以 ] 终止 
指向 void 的 指针 
将 到 目前 为 止 该 函数 调用 读 取 的 字符 数 写 入 到 指针 所 指向 的 无 符号 整 型 中 
一 个 % 符 号 
REE (XSI 扩展 ， 等 效 于 1c) 
宽 字符 串 (XSI 扩展 ， 等 效 于 1s) 


图 5-10 转换 说 明 中 的 转换 类 型 
与 printf 族 相同 ，scanf 族 也 使 用 由 <stdarg.h> 说 明 的 可 变 长 度 参 数 表 。 


#include <stdarg.h> 





#include <stdio.h> 


int vscanf(const char *restrict format, va_list arg); 
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int vfscanf(FILE *restrict fp, const char *restrict format, va_list arg); 


int vsscanf(const char *restrict buf, const char *restrict format, va_list arg); 


3 个 函数 返回 值 ， 指 定 的 输入 项 目 数 ， 考 输入 出 错 或 在 任 一 转换 前 文件 结束 ， 返 回 BOF 
关于 scanf 函数 族 的 详细 情况 ， 请 参阅 UNIX 系统 手册 。 163 
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正如 前 述 ， 在 UNIX 中 ， 标 准 VO 库 最 终 都 要 调用 第 3 章 中 说 明 的 VO 例 程 。 每 个 标准 VO 
流 都 有 一 个 与 其 相关 联 的 文件 描述 符 ， 可 以 对 一 个 流 调用 fileno 函数 以 获得 其 描述 符 。 


注意 ，fileno 不 是 ISO C HEBD, 而 是 POSIX.1 支持 的 扩展 。 


#include <stdio.h> 


int fileno(FILE *fp); 





返回 值 : 与 该 流 相 关联 的 文件 描述 符 


如 果 要 调用 dup 或 fcnt1l 等 函数 ， 则 需要 此 函数 。 

为 了 了 解 你 所 使 用 的 系统 中 标准 VO 库 的 实现 ， 最 好 从 头 文件 <stdio .h> 开 始 。 从 中 可 以 看 到 
FILE 对 象 是 如 何 定义 的 、 每 个 流标 志 的 定义 以 及 定义 为 宏 的 各 个 标准 IO 例 程 (如 getc). Kernighan 
和 Ritchie[1988] 中 的 8.5 节 含有 一 个 示例 实现 ， 从 中 可 以 看 到 很 多 UNIX 实现 的 基本 样式 。Plauger[1992] 
的 第 12 章 提 供 了 标准 IO 库 一 种 实现 的 全 部 源 代码 。GNU 标准 VO 库 的 实现 也 是 公开 可 用 的 。 


EA 
图 5-11 程序 为 3 个 标准 流 以 及 一 个 与 普通 文件 相关 联 的 流 打 印 有 关 缓冲 的 状态 信息 。 


#include "apue.h" 


Void pr_stdio(const char *, FILE *); 
int is_unbuffered(FILE *); 

int is_linebuffered(FILE *); 

int buffer_size(FILE *); 

int 


main (void) 
{ 
FILE *fp; 


fputs("enter any character\n", stdout); 
if (getchar() == EOF) 
err_sys("getchar error"); 


fputs("one line to standard error\n", stderr); 

pr_stdio("stdin", stdin); 

pr_stdio("stdout", stdout); 

pr_stdio("stderr", stderr); 
if ((fp = fopen("/etc/passwd", "r")) == NULL) 


err_sys("fopen error"); 
if (getc(fp) == EOF) 


132 SMO O 


err sys("getc error"); 
pr stdio("/etc/passwd", fp); 
exit(0); 


void 
pr stdio(const char *name, FILE *fp) 
{ 
printf ("stream = $s, ", name); 
if (is unbuffered (fp) ) 
printf ("unbuffered") ; 
else if (is linebuffered(fp)) 
printf("line buffered"); 
else /* if neither of above */ 
printf ("fully buffered"); 
printf(", buffer size = $dMn", buffer size(fp)); 


/* 
* The following is nonportable. 
xf 


#if defined (_IO_UNBUFFERED) 


int 
is_unbuffered (FILE *fp) 


{ 
return(fp->_flags & _IO_UNBUFFERED) ; 


int 
is_linebuffered(FILE *fp) 
{ 
return(fp->_flags & _IO_LINE_BUF) ; 


int 
buffer_size(FILE *fp) 


{ 
return(fp-» IO buf end - fp-» IO buf base); 


delif defined( SNBF) 


int 
is unbuffered(FILE *fp) 
{ 


} 


int 
is_linebuffered(FILE *fp) 
{ 


return(fp->_flags & _SNBF); 


return(fp->_flags & _SLBF); 
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int 
buffer_size(FILE *fp) 
{ 
return (fp->_bf._size) ; 


} 


felif defined (_IONBF) 


#ifdef _LP64 

#define _flag _pad[4] 
#define ptr _pad[1] 
#define base _pad[2] 
#endif 


int 
is_unbuffered(FILE *fp) 
{ 
return(fp->_flag & _IONBF); 
} 


int 
is_linebuffered(FILE *fp) 
{ 
return(fp->_flag & _IOLBF); 
} 


int 
buffer_size(FILE *fp) 
{ 
#ifdef _LP64 
return(fp->_base - fp->_ptr); 
#else 
return (BUFSIZ) ; /* just a guess */ 
#endif 
} 


#else 


#error unknown stdio implementation! 


#endif 








图 5-11 对 各 个 标准 IO 流 打印 缓冲 状态 信息 
注意 ， 在 打印 缓冲 状态 信息 之 前 ， 先 对 每 个 流 执行 VO 操作 ， 第 一 个 VO 操作 通常 就 造成 为 
该 流 分 配 缓冲 区 。 本 例 中 的 结构 成 员 和 常量 是 由 本 书 中 使 用 的 4 种 平台 实现 的 标准 IO 库 定义 的 。[166] 
应 当 了 解 ， 标 准 VO 库 实 现在 不 同 的 系统 中 可 能 有 所 不 同 ， 像 本 例 中 的 程序 是 不 可 移植 的 ， 因 为 
它们 嵌入 了 与 特定 实现 相关 的 内 容 。 
如 果 运 行 图 5-11 的 程序 两 次 , 一 次 使 3 个 标准 流 与 终端 相连 接 ， 另 一 次 使 它们 重 定向 到 普通 
文件 ， 则 所 得 结果 是 : 


$ ./a.out stdin, stdout 和 stderr 都 连 至 终端 
enter any character 
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键入 换行 符 


one line to standard error 


stream = stdin, line buffered, buffer size = 1024 
stream = stdout, line buffered, buffer size = 1024 
stream = stderr, unbuffered, buffer size = 1 


stream = /etc/passwd, fully buffered, buffer size = 4096 
$ .f/a.out < /etc/group > std.out 2» std.err 
3 个 流 都 重 定向 ， 再 次 运行 该 程序 
$ cat std.err 
one line to standard error 
$ cat std.out 
enter any character 
stream = stdin, fully buffered, buffer size = 4096 


stream = stdout, fully buffered, buffer size = 4096 
stream = stderr, unbuffered, buffer size = 1 
stream = /etc/passwd, fully buffered, buffer size = 4096 


从 中 可 见 ， 该 系统 的 默认 是 : 当 标 准 输入 、 和 输出 连 至 终端 时 ， 它 们 是 行 缓冲 的 。 行 缓冲 的 长 度 
是 1024 字 节 。 注 意 ， 这 并 没有 将 输入 、 和 输出 的 行 长 限制 为 1 024 字 节 ， 这 只 是 缓冲 区 的 长 度 。 如 
果 要 将 2 048 字 节 的 行 写 到 标准 输出 ， 则 要 进行 两 次 write 系统 调用 。 当 将 这 两 个 流 重 新 定向 到 普 
通 文件 时 ， 它 们 就 变 成 是 全 缓冲 的 ， 其 缓冲 区 长 度 是 该 文件 系统 优先 选用 的 IO KE A stat Zi 
构 中 得 到 的 st_blksize 值 )。 从 中 也 可 看 到 ， 标 准 错误 如 它 所 应 该 的 那样 是 不 带 缓冲 的 ， 而 普 
通 文件 按 系统 默认 是 全 缓冲 的 。 m 
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ISO C 标准 VO 库 提供 了 两 个 函数 以 帮助 创建 临时 文件 。 


#include<stdio.h> 


char *tmpnam(char *ptr); 
返回 值 : 指向 唯一 路 径 名 的 指针 
FILE *tmpfile (void); 


返回 值 : 若 成 功 ， 返 回 文件 指针 ;， 若 出 错 ， 返 回 NULL 





tmpnam 函数 产生 一 个 与 现 有 文件 名 不 同 的 一 个 有 效 路 径 名 字符 串 。 每 次 调用 它 时 ， 都 产生 
一 个 不 同 的 路 径 名 ， 最 多 调用 次 数 是 TMP_MAX。TMP_MAX 定义 在 <stdio .h> 中 。 
虽然 ISOC 定义 了 TMP_MAX， 但 该 标准 只 要 求 其 值 至 少 应 为 25。 但 是 ，Single UNIX Specification 
却 要 求 符合 XSI 的 系统 支持 其 值 至 少 为 10 000。 虽 然 此 最 小 值 允许 一 个 实现 使 用 4 位 数字 ( 0000 ~ 
9999 ) 作为 临时 文件 名 ， 但 是 ， 大 多 数 UNIX 实现 使 用 的 却 是 大 、 小 写字 符 。 
tmpnam Hat fe SUSv4 中 被 标记 为 齐 用 ， 但 是 ISO C 标准 还 继续 支持 它 。 


车 ptr 是 NULL， 则 所 产生 的 路 径 名 存放 在 一 个 静态 区 中 ， 指 向 该 静态 区 的 指针 作为 函数 值 返 
回 。 后续 调 用 tmpnam 时 ， 会 重 写 该 静态 区 〈 这 意味 着 ， 如 果 我 们 调用 此 函数 多 次 ， 而 且 想 保存 
路 径 名 ， 则 我 们 应 当 保存 该 路 径 名 的 副本 ， 而 不 是 指针 的 副本 )。 如 若 pir 不 是 NULL, WANE 
应 该 是 指向 长 度 至 少 是 L_tmpnam 个 字符 的 数组 (常量 L_tmpnam 定 义 在 头 文件 <stdio.h> 中 )。 
所 产生 的 路 径 名 存放 在 该 数组 中 ，pitr 也 作为 函数 值 返回 。 

tmpfile 创建 一 个 临时 二 进 制 文件 〈 类 型 wb+)， 在 关闭 该 文件 或 程序 结束 时 将 自动 删除 这 
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种 文件 。 注 意 ，UNIX 对 二 进 制 文件 不 进行 特殊 区 分 。 


a XI 
图 5-12 程序 说 明了 这 两 个 函数 的 应 用 。 


#include "apue.h" 








int 
main (void) 
{ 
charname[L tmpnam], line[MAXLINE]; 


FILE *fp; 
printf("$sWMn", tmpnam(NULL)); /* first temp name */ 
tmpnam (name); /* second temp name */ 


printf("%s\n", name); 


if ((fp = tmpfile()) -- NULL) /* create temp file */ 
err sys("tmpfile error"); 
fputs("one line of output\n", fp); /* write to temp file */ 


rewind(fp); /* then read it back */ 
if (fgets(line, sizeof(line), fp) == NULL) 
err sys("fgets error"); 
fputs(line, stdout); /* print the line we wrote */ 
exit(0); 


图 5-12 tmpnam 和 tmpfile 函数 实例 
执行 图 5-12 的 程序 ， 可 得 : 


$ ./a.out 

/tmp/fileTO0Hsu6 

/tmp/filekmAsYQ : 
one line of output a 


tmpfile 函数 经 常 使 用 的 标准 UNIX 技术 是 先 调 用 tmpnam 产生 一 个 唯一 的 路 径 名 ， 然 后 ， 
用 该 路 径 名 创建 一 个 文件 ， 并 立即 unlink 它 。 请 回忆 4.15 节 ， 对 一 个 文件 解除 链接 并 不 删除 其 
内 容 ， 关 闭 该 文件 时 才 删 除 其 内 容 。 而 关闭 文件 可 以 是 显 式 的 ， 也 可 以 在 程序 终止 时 自动 进行 。 

Single UNIX Specification 为 处 理 临 时 文件 定义 了 另外 两 个 函数 : mkdtemp 和 mkstemp, 它 
们 是 XSI 的 扩展 部 分 。 


#include <stdlib.h> 





char *mkdtemp(char *femplate) ; 
返回 值 ， 若 成 功 ， 返 回 指向 目录 名 的 指针 ;， 若 出 错 ， 返 回 NULL 


int mkstemp (char *template) ; 


返回 值 : 若 成 功 ， 返 回 文 件 描述 符 ， 若 出 错 ， 返 回 -1 





mkdtemp 函数 创建 了 一 个 目录 ， 该 目录 有 一 个 唯一 的 名 字 ; mkstemp 函数 创建 了 一 个 文件 ， 
该 文件 有 一 个 唯一 的 名 字 。 名 字 是 通过 template 字符 串 进 行 选择 的 。 这 个 字符 串 是 后 6 位 设置 为 
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XXXXXX 的 路 径 名 。 函 数 将 这 些 占 位 符 蔡 换 成 不 同 的 字符 来 构建 一 个 唯一 的 路 径 名 。 如 果 成 功 的 
话 ， 这 两 个 函数 将 修改 template 字符 串 反映 临时 文件 的 名 字 。 

由 mkdtemp 函数 创建 的 目录 使 用 下 列 访问 权限 位 集 : S_IRUSR | S IWUSR | S_IXUSR。 注 
意 ， 调 用 进程 的 文件 模式 创建 屏蔽 字 可 以 进一步 限制 这 些 权限 。 如 果 目 录 创 建成 功 ，mkdtemp 
返回 新 目录 的 名 字 。 

mkstemp 函数 以 唯一 的 名 字 创建 一 个 普通 文件 并 且 打开 该 文件 , 该 函数 返回 的 文件 描述 符 以 
读 写 方式 打开 。 由 mkstemp 创建 的 文件 使 用 访问 权限 位 S IRUSR | S_IWUSR。 

与 tempfile JE], mkstemp 创建 的 临时 文件 并 不 会 自动 删除 。 如 果 希 望 从 文件 系统 命名 
空间 中 删除 该 文件 ， 必 须 自 己 对 它 解除 链接 。 

使 用 tmpnam 和 tempnam 至 少 有 一 个 缺点 : 在 返回 唯一 的 路 径 名 和 用 该 名 字 创 建文 件 之 间 
存在 一 个 时 间 窗 口 ， 在 这 个 时 间 窗 口中 ， 另 一 进程 可 以 用 相同 的 名 字 创 建文 件 。 因 此 应 该 使 用 
tmpfile 和 mkstemp 函数 ， 因 为 它们 不 存在 这 个 问题 。 


下 实例 
图 5-13 程序 显示 了 如 何 使 用 mkstemp 函数 。 





#include "apue.h" 
#include <errno.h> 


void make temp(char *template) ; 


int 

main() 

{ 
char good template[] = "/tmp/dirXXXXXX"; /* right way */ 
char *bad template - "/tmp/dirXXXXXX"; /* wrong way*/ 


printf("trying to create first temp file...\n"); 
make temp(good template); 
printf("trying to create second temp file...\n"); 
make temp (bad template); 
exit(0); 

} 


void 
make_temp (char *template) 
{ 
int fd; 
struct stat sbuf; 


if ((fd = mkstemp(template)) < 0) 
err sys("can't create temp file"); 
printf("temp name = %s\n", template); 
close(fd); 
if (stat(template, &sbuf) < 0) { 
if (errno == ENOENT) 
printf("file doesn't exist\n"); 
else 
err sys("stat failed"); 
) else ( 
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printf("file exists\n"); 
unlink (template); 


图 5-13 mkstemp 函数 的 应 用 
运行 图 5.13 中 的 程序 ， 得 到 : 


$ ./a.out 
trying to create first temp file... 
temp name - /tmp/dirUmBT7h 


file exists 


trying to create second temp file... 
Segmentation fault 


两 个 模板 字符 串 声明 方式 的 不 同 带 来 了 不 同 的 运行 结果 。 对 于 第 一 个 模板 ,因为 使 用 了 数组 ， 
名 字 是 在 栈 上 分 配 的 。 但 第 二 种 情况 使 用 的 是 指针 ， 在 这 种 情况 下 ， 只 有 指针 自身 驻 留 在 栈 上 。 
编译 器 把 字符 串 存 放 在 可 执行 文件 的 只 读 段 ， 当 mkstemp 函数 试图 修改 字符 串 时 ， 出 现 了 段 错 


ix (segment fault). a 
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我 们 已 经 看 到 ， 标 准 IO 库 把 数据 缓存 在 内 存 中 ， 因 此 每 次 一 字符 和 每 次 一 行 的 IO 更 有 效 。 
我 们 也 可 以 通过 调用 setbuf 或 setvbuf 函数 让 LO 库 使 用 我 们 自己 的 缓冲 区 。 在 SUSv4 PX 
持 了 内 存 流 。 这 就 是 标准 VO 流 ， 虽 然 仍 使 用 PILE 指针 进行 访问 ， 但 其 实 并 没有 底层 文件 。 所 
有 的 IO 都 是 通过 在 缓冲 区 与 主 存 之 间 来 回 传送 字 节 来 完成 的 。 我 们 将 看 到 ， 即 便 这 些 流 看 起 来 
像 文 件 流 ， 它 们 的 某 些 特征 使 其 更 适用 于 字符 串 操 作 。 

有 3 个 函数 可 用 于 内 存 流 的 创建 ， 第 一 个 是 fmemopen MA. 


#include <stdio.h> 


FILE *fmemopen(void *restrict buf, size_t size, const char *restrict type); 


返回 值 : 若 成 功 ， 返 回流 指针 ， 若 错误 ， 返 回 NULL 





fmemopen 函数 允许 调用 者 提供 缓冲 区 用 于 内 存 流 : buf 参数 指向 缓冲 区 的 开始 位 置 ，size 
参数 指定 了 缓冲 区 大 小 的 字 节 数 。 如 果 buf 参数 为 定 ，fmemopen 函数 分 配 size 字 节 数 的 缓冲 区 。 
在 这 种 情况 下 ， 当 流 关 闭 时 缓冲 区 会 被 释放 。 

type 参数 控制 如 何 使 用 流 。type 可 能 的 取 值 如 图 5-14 Bron. 



















r 或 rb 为 读 而 打开 







w 或 wb 为 写 而 打开 
a Rab 追加 ; 为 在 第 一 个 null 字 节 处 写 而 打开 
z+ 或 上 +b 或 rb+ 为 读 和 写 而 打开 


w+ 或 w+b 或 wb+ 把 文件 截断 至 0 长 ， 为 读 和 写 而 打开 
a+ 或 a+b 或 ab+ 追加 ; 为 在 第 一 个 null 字 节 处 读 和 写 而 打开 


图 5-14 打开 内 存 流 的 type 参数 
注意 , 这 些 取 值 对 应 于 基于 文件 的 标准 VO 流 的 type 参数 取 值 , 但 其 中 有 些微 小 差别 。 第 一 ， 
无 论 何 时 以 追加 写 方式 打开 内 存 流 时 ， 当 前 文件 位 置 设 为 缓冲 区 中 的 第 一 个 null 字 节 。 如 果 缓 冲 
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区 中 不 存在 null 字 节 ， 则 当前 位 置 就 设 为 缓冲 区 结尾 的 后 一 个 字 节 。 当 流 并 不 是 以 追加 写 方 式 打 
开 时 ， 当 前 位 置 设 为 缓冲 区 的 开始 位 置 。 因 为 追加 写 模 式 通 过 第 一 个 null 字 节 确定 数据 的 尾 端 ， 
内 存 流 并 不 适合 存储 二 进 制 数据 (二进制 数 据 在 数据 尾 端 之 前 就 可 能 包含 多 个 null 字 节 )。 

第 二 ， 如 果 buf 参数 是 一 个 null 指针 ， 打 开 流 进行 读 或 者 写 都 没有 任何 意义 。 因 为 在 这 种 情 
况 下 缓冲 区 是 通过 fmemopen 进行 分 配 的 , 没有 办 法 找到 缓冲 区 的 地 址 ， 只 写 方式 打开 流 意 味 着 
无 法 读 取 已 写 入 的 数据 ， 同 样 ， 以 读 方 式 打开 流 意味 着 只 能 读 取 那 些 我 们 无 法 写 入 的 缓冲 区 中 的 
数据 。 

第 三 ， 任 何 时 候 需要 增加 流 缓冲 区 中 数据 量 以 及 调用 fclose、fflush、fseek、fseeko 
以 及 fsetpos 时 都 会 在 当前 位 置 写 入 一 个 null 字 节 。 


s KB 


有 必要 看 一 下 对 内 存 流 的 写 入 是 如 何在 我 们 自己 提供 的 缓冲 区 上 进行 操作 的 。 图 5-15 给 出 了 
用 已 知 模式 填充 缓冲 区 时 流 写 入 是 如 何 操作 的 。 


#include "apue.h" 
#define BSZ 48 


int 
main () 
{ 
FILE *fp; 
char buf [BSZ]; 


memset (buf, 'a', BSZ-2); 


buf [BSZ-2] = 'N0'; 
buf[BSZ-1] = 'X'; 
if ((fp = fmemopen (buf, BSZ, "w+")) == NULL) 


err_sys("fmemopen failed"); 
printf("initial buffer contents: %s\n", buf); 
fprintf(fp, "hello, world"); 
printf ("before flush: %s\n", buf); 
fflush(fp); 
printf("after fflush: %s\n", buf); 
printf("len of string in buf = %ld\n", (long)strlen(buf)); 


memset (buf, 'b', BSZ-2); 

buf [BSZ-2] "yoz 

buf [BSZ-1] a a 

fprintf(fp, “hello, world"); 

fseek(fp, 0, SEEK_SET); 

printf("after fseek: %s\n", buf); 

printf ("len of string in buf = %ld\n", (long)strlen(buf)); 


iow 


memset (buf, 'c', BSZ-2); 


buf[BSZ-2] = '\0'; 

buf [BSZ-1] = 'X'; 
fprintf(fp, "hello, world"); 
fclose (fp); 


printf ("after fclose: %s\n", buf); 
printf ("len of string in buf = %ld\n", (long)strlen(buf)); 
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return(0); 


图 5-15 观察 内 存 流 的 写 入 操作 
我 们 在 Linux 上 运行 该 程序 ， 得 到 如 下 结果 : 


$ ./a.out 
用 a 字符 改写 缓冲 区 
initial buffer contents: fmemopen 在 缓冲 区 开始 处 放置 null 字 节 
before flush: 流 冲 洗 后 缓冲 区 才 会 变化 
after fflush: hello, world 
len of string in buf = 12 null 字 节 加 到 字符 串 结尾 
现在 用 b 字符 改写 缓冲 区 
after fseek: bbbbbbbbbbbbhello, world fseek 引起 缓冲 区 冲洗 
len of string in buf = 24 再 次 追加 写 null 字 节 


现在 用 c 字符 改写 缓冲 区 
after fclose: hello, worldcccccccccccccccccccccccccccccccccc 
len of string in buf - 46 没有 追加 写 null 字 节 


这 个 例子 给 出 了 冲洗 内 存 流 和 追加 写 null 字 节 的 策略 . 写 入 内 存 流 以 及 推进 流 的 内 容 大 小 ( 相 
对 缓冲 区 大 小 而 言 ， 该 大 小 是 固定 的 ) 这 个 概念 时 ，null 字 节 会 自动 追加 写 。 流 内 容 大 小 是 由 写 
入 多 少 来 确定 的 。 
在 本 书 所 讨论 的 4 个 平台 中 ， 只 有 Linux 3.2.0 支持 内 存 流 。 这 是 具体 实现 还 没有 跟 上 最 新 的 标 
准 ， 相 信 随 着 时 间 的 推移 ， 这 种 情况 会 有 所 改变 。 * 
用 于 创建 内 存 流 的 其 他 两 个 函数 分 别 是 open memstream 和 open wmemstream. 


#include <stdio.h> 





FILE *open memstream(char **bufp, size t *sizep); 


#include <wchar.h> 





FILE *open wmemstream(wchar t **bufp, size t *sizep) ; 


两 个 函数 的 返回 值 ， 若 成 功 ， 返 回流 指针 ， 若 出 错 ， 返 回 NULL 


open memstream 水 数 创建 的 流 是 面向 字 节 的 , open_wmemstream 函数 创建 的 流 是 面向 
宽 字 节 的 (回忆 5.2 节 中 对 于 多 字 节 字符 的 说 明 )。 这 两 个 函数 与 fmemopen 函数 的 不 同 在 于 : 

。 创建 的 流 只 能 写 打开 ; 

。 不 能 指定 自己 的 缓冲 区 ， 但 可 以 分 别 通过 bufp 和 sizep 参数 访问 缓冲 区 地 址 和 大 小 ; 

。 关闭 流 后 需要 自行 释放 绥 冲 区 ， 

。 对 流 添加 字 节 会 增加 缓冲 区 大 小 。 

但 是 在 缓冲 区 地 址 和 大 小 的 使 用 上 必须 遵循 一 些 原则 。 第 一 ， 缓 冲 区 地 址 和 长 度 只 有 在 调用 
fclose 或 fflush 后 才 有 效 ; 第 二 ， 这 些 值 只 有 在 下 一 次 流 写 入 或 调用 fclose 前 才 有 效 。 因 
为 缓冲 区 可 以 增长 ， 可 能 需要 重新 分 配 。 如 果 出 现 这 种 情况 ， 我 们 会 发 现 缓冲 区 的 内 存 地 址 值 在 
下 一 次 调用 fclose 或 fflush 时 会 改变 。 

因为 避免 了 缓冲 区 溢出 ， 内 存 流 非常 适用 于 创建 字符 串 。 因 为 内 存 流 只 访问 主 存 ， 不 访 
问 磁 盘 上 的 文件 , 所 以 对 于 把 标准 IO 流 作 为 参数 用 于 临时 文件 的 函数 来 说 , 会 有 很 大 的 性 能 
提升 。 
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5.15 标准 I/O 的 替代 软件 


标准 VO 库 并 不 完善 。 Korn 和 Vo[1991] 列 出 了 它 的 很 多 不 足 之 处 , 其中, 某 些 属于 基本 设计 ， 
但 是 大 多 数 则 与 各 种 不 同 的 实现 有 关 。 

标准 VO 库 的 一 个 不 足 之 处 是 效率 不 高 ， 这 与 它 需要 复制 的 数据 量 有 关 。 当 使 用 每 次 一 行 函 
数 fgets 和 fputs 时 ,通常 需要 复制 两 次 数据 :一 次 是 在 内 核 和 标准 1/0 缓冲 区 之 间 ( 当 调用 read 
和 write IN), 第 二 次 是 在 标准 VO 缓冲 区 和 用 户 程序 中 的 行 缓冲 区 之 间 。 快速 VO 库 [AT&T 1990a 
中 的 fio(3)] 避 免 了 这 一 点 ， 其 方法 是 使 读 一 行 的 函数 返回 指向 该 行 的 指针 ， 而 不 是 将 该 行 复制 到 
另 一 个 缓冲 区 中 。Hume[1988] 报 告 : 由 于 做 了 这 种 更 改 ，grep(1) 实 用 程序 的 速度 提升 了 3 倍 。 

Korn 和 Vo[1991] 说 明了 标准 VO 库 的 另 一 种 替代 版 : sfio。 这 一 软件 包 在 速度 上 与 fio 相近 ， 
通常 快 于 标准 VO PE. sfio 软件 包 也 提供 了 一 些 其 他 标准 VO 库 所 没有 的 新 特征 : 推广 了 VO 流 ， 
使 其 不 仅 可 以 代表 文件 ， 也 可 代表 存储 区 ; 可 以 编写 处 理 模 块 ， 并 以 栈 方式 将 其 压 入 VO 流 ， 这 
样 就 可 以 改变 一 个 流 的 操作 ; 较 好 的 异常 处 理 等 。 

Krieger. Stumm 和 Unrau[1992] 说 明了 另 一 个 替代 软件 包 , 它 使 用 了 映射 文件 一 一 mmap 函数 ， 
我 们 将 在 14.8 节 中 说 明 此 函数 。 该 新 软件 包 称 为 ASI (Alloc Stream Interface )。 其 编程 接口 类 似 
F UNIX 系统 存储 分 配 函 数 (malloc、realloc 和 free， 这 些 函 数 将 在 7.8 节 中 说 明 )。 与 sfio 
软件 包 相 同 ，ASI 使 用 指针 力图 减少 数据 复制 量 。 

许多 标准 VO 库 实 现在 C 函数 库 中 可 用 ， 这 种 C 函数 库 是 为 内 存 较 小 的 系统 ， 如 岗 入 式 系统 设计 
的 。 这 些 实现 对 于 合理 内 存 要 求 的 关注 超过 对 可 移植 性 、 速 度 以 及 功能 性 等 方面 的 关注 。 这 种 类 型 函数 
库 的 两 种 实现 是 : uClibe C 库 (参阅 http://www.uclibc.org) 和 Newlib C E (http://www. 


source.redhat.com/newlib). 
5.16 Wes 


大 多 数 UNIX 应 用 程序 都 使 用 标准 VO 库 。 本 章 说 明了 该 库 提 供 的 很 多 函数 以 及 某 些 实现 细节 和 效 
率 方面 的 考虑 。 应 该 看 到 , 标准 VO 库 使 用 了 缓冲 技术 ， 而 它 正 是 产生 很 多 问题 、 引 起 许多 混淆 的 部 分 。 


习题 


5.1 用 setvbuf 实现 setbuf. 

52 ”图 5-5 中 的 程序 利用 每 次 一 行 IJO (fgets 和 fputs 函数 ) 复制 文件 。 若 将 程序 中 的 MAXLINE 
改 为 4， 当 复制 的 行 超过 该 最 大 值 时 会 出 现 什 么 情况 ? 对 此 进行 解释 。 

53 printf 返回 0 值 表示 什么 ? 

5.4 ”下面 的 代码 在 一 些 机 器 上 运行 正确 ， 而 在 另外 一 些 机 器 运行 时 出 错 ， 解 释 问 题 所 在 。 


#include <stdio.h> 


int 
main (void) 
{ 


char C}; 


5.5 
5.6 


5.7 
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while ((c = getchar()) != EOF) 
putchar (c); 
} 


对 标准 VO 流 如 何 使 用 fsync 函数 (HL 3.13 节 ) ? 

在 图 1-7 和 图 1-10 程序 中 ， 打 印 的 提示 信息 没有 包含 换行 符 ， 程 序 也 没有 调用 fflush PR 
数 ， 请 解释 输出 提示 信息 的 原因 是 什么 ? 

基于 BSD 的 系统 提供 了 funopen 的 函数 调用 使 我 们 可 以 拦截 读 、 写 、 定 位 以 及 关闭 一 个 
流 的 调用 。 使 用 这 个 函数 为 FreeBSD 和 Mac OS X 实现 fmemopen。 
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6.1 引言 


UNIX 系统 的 正常 运作 需要 使 用 大 量 与 系统 有 关 的 数据 文件 , 例如 , 口令 文件 /etc/passwd 
和 组 文件 /etc/group 就 是 经 常 被 多 个 程序 频繁 使 用 的 两 个 文件 。 用 户 每 次 登录 UNIX 系统 ， 以 
及 每 次 执行 1s -1 命令 时 都 要 使 用 口令 文件 。 

由 于 历史 原因 ， 这些 数据 文件 都 是 ASCII 文本 文件 ， 并 且 使 用 标准 IO 库 读 这 些 文件 。 但 是 ， 
对 于 较 大 的 系统 ， 顺 序 扫描 口令 文件 很 花费 时 间 ， 我 们 需要 能 够 以 非 ASCI 文本 格式 存放 这 些 文 
件 ， 但 仍 向 使 用 其 他 文件 格式 的 应 用 程序 提供 接口 。 对 于 这 些 数据 文件 的 可 移植 接口 是 本 章 的 主 
题 。 本 章 也 包括 了 系统 标识 函数 、 时 间 和 日 期 函数 。 


6.2 口令 文件 


UNIX 系统 口令 文件 (POSIX.1 则 将 其 称 为 用 户 数据 库 ) 包含 了 图 6-1 中 所 示 的 各 字段 ， 这 
些 字段 包含 在 <pwd.h> 中 定义 的 passwd 结构 中 。 
注意 ，POSIX.1 只 指定 passwd 结构 包含 的 10 个 字段 中 的 5 个 。 大 多 数 平 台 至 少 支持 其 中 7 
个 字段 。BSD 派生 的 平台 支持 全 部 10 个 字段 。 


FreeBSD | Linux ES 
说 明 struct passwd 成 员 POSIX.1 Poser | ir | es X 10.68 


用 户 有 名 | char *pw_name 

加 密 口令 char *pw_passwd 
数值 用 户 ID uid t pw uid 
数值 组 ID gid_t pw_gid 
注释 字段 char *pw_gecos 
初始 工作 目录 char *pw_dir 
初始 shell (用 户 程序 ) | char *pw shell 
用 户 访问 类 char *pw_class 
下 次 更 改口 令 时 间 time_t pw_change 
账户 有 效 期 时 间 time_t pw_expire 


图 6-1 /etc/passwa 文件 中 的 字段 
由 于 历史 原因 ， 口 令 文 件 是 /etc/passwd， 而 且 是 一 个 ASCI 文件 。 每 一 行 包含 图 6-1 中 
所 示 的 各 字段 ， 字 段 之 间 用 冒号 分 隔 。 例 如 ， 在 Linux 中 ， 该 文件 中 可 能 有 下 列 4 íT: 
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root:x:0:0:root:/root:/bin/bash 
squid:x:23:23::/var/spool/squid:/dev/null 
nobody: x: 65534: 65534:Nobody: /home: /bin/sh 
sar:x:205:105:Stephen Rago:/home/sar:/bin/bash 


关于 这 些 登 录 项 ， 请 注意 下 列 各 点 : 

。 通常 有 一 个 用 户 名 为 root 的 登录 项 ， 其 用 户 ID 是 0 (超级 用 户 )。 

e 加密 口 令 字 段 包 含 了 一 个 占 位 符 。 较 早期 的 UNIX 系统 版 本 中 ， 该 字段 存放 加 密 口 令 字 。 
将 加 密 口 令 字 存放 在 一 个 人 人 可 读 的 文件 中 是 一 个 安全 性 漏洞 ， 所 以 现在 将 加 密 口令 字 
存放 在 另 一 个 文件 中 。 在 下 一 节 讨论 口令 字 时 ， 我 们 将 详细 涉及 此 问题 。 

e 口令 文件 项 中 的 某 些 字段 可 能 是 空 。 如 果 加 密 口令 字段 为 定 ， 这 通常 就 意味 着 该 用 户 没有 口 
S (不 推荐 这 样 做 )。squid 登录 项 有 一 空白 字段 : 注释 字段 。 空白 注释 字段 不 产生 任何 影响 。 

e shell 字段 包含 了 一 个 可 执行 程序 名 ， 它 被 用 作 该 用 户 的 登录 shell。 若 该 字段 为 空 ， 则 取 系统 默 
认 值 , 通常 是 /bin/sh。 HEM, squid 登录 项 的 该 字段 为 /dev/null。 显 然 ， 这 是 一 个 设备 ， 
不 是 可 执行 文件 ， 将 其 用 于 此 处 的 目的 是 ， 阻 止 任何 人 以 用 户 squid 的 名 义 登 录 到 该 系统 。 


很 多 服务 对 于 帮助 它们 得 以 实施 的 不 同 守护 进程 使 用 不 同 的 用 户 ID ( 见 第 13 章 )，squid 
项 是 为 实现 squid 代理 高 速 缓存 服务 的 进程 设置 的 。 


e. 为 了 阻止 一 个 特定 用 户 登 录 系统 ， 除 使 用 /dev/null 外 ， 还 有 若干 种 替代 方法 。 常 见 的 
一 种 方法 是 ， 将 /bin/false 用 作 登 录 shell。 它 简单 地 以 不 成 功 〈 非 00 状态 终止 ， 该 
shell 将 此 种 终止 状态 判断 为 假 。 另 一 种 常见 方法 是 ， 用 /bin/true 禁止 一 个 账户 。 它 所 
做 的 一 切 是 以 成 功 (0) 状态 终止 。 某 些 系统 提供 nologin 命令 ， 它 打印 可 定制 的 出 错 
信息 ， 然 后 以 非 0 状态 终止 。 

e [iH nobody 用 户 名 的 一 个 目的 是 , 使 任何 人 都 可 登录 至 系统 ,但 其 用 户 ID (65534) 和 
组 ID (65534) 不 提供 任何 特权 。 该 用 户 ID 和 组 ID 只 能 访问 人 人 皆 可 读 、 写 的 文件 。( 假 
定 用 户 ID 65534 和 组 ID 65534 并 不 拥有 任何 文件 ， 而 实际 情况 就 应 如 此 。) 

。 提供 finger(1) 命 令 的 某 些 UNIX 系统 支持 注释 字段 中 的 附加 信息 。 其 中 ， 各 部 分 之 间 
都 用 逗号 分 隔 : 用 户 姓名 、 办 公 室 地 点 、 办 公 室 电话 号 码 以 及 家 庭 电话 号 码 等 。 另 外 ， 
如 果 注 释 字 段 中 的 用 户 姓名 是 一 个 &， 则 它 被 替换 为 登录 名 。 例 如 ， 可 以 有 下 列 记录 : 


sar:x:205:105:Steve Rago, SF 5-121, 555-1111, 555-2222:/home/sar:/bin/sh 
使 用 finger 命令 就 可 打印 Steve Rago 的 有 关 信 息 。 


$ finger -p sar 


Login: sar Name: Steve Rago 
Directory: /home/sar Shell: /bin/sh 
Office: SF 5-121, 555-1111 Home Phone: 555-2222 
On since Mon Jan 19 03:57 (EST) on ttyvO (messages off) 

No Mail. 


即使 你 所 使 用 的 系统 并 不 支持 finger 命令 ， 这 些 信息 仍 可 存放 在 注释 字段 中 ， 该 字段 只 是 
一 个 注释 ， 并 不 由 系统 实用 程序 解释 。 
某 些 系统 提供 了 vipw 命令 ， 人 允许 管理 员 使 用 该 命令 编辑 口令 文件 。vipw 命令 串 行 化 地 更 
改口 令 文 件 ， 并 且 确 保 它 所 做 的 更 改 与 其 他 相关 文件 保持 一 致 。 系 统 也 常常 经 由 图 形 用 户 界 面 
(GUI) 提供 类 似 的 功能 。 
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POSIX.1 定义 了 两 个 获取 口令 文件 项 的 函数 。 在 给 出 用 户 登录 名 或 数值 用 户 ID 后 , 这 两 个 函 
数 就 能 查看 相关 项 。 
#include<pwd.h> 
struct passwd *getpwuid(uid t uid); 
struct passwd *getpwnam(const char *name) ; 
两 个 函数 返回 值 ， 若 成 功 ， 返 回 指针 ; 若 出 错 ， 返 回 NULL 
179 getpwuid 函数 由 1s(1) 程 序 使 用 ， 它 将 i 节点 中 的 数字 用 户 ID 映射 为 用 户 登 录 名 。 在 键入 
登录 名 时 ，getpwnam 函数 由 login(1) 程 序 使 用 。 

这 两 个 函数 都 返回 一 个 指向 passwd 结构 的 指针 , 该 结构 已 由 这 两 个 函数 在 执行 时 填 入 
fad. passwd 结构 通常 是 函数 内 部 的 静态 变量 ， 只 要 调用 任 一 相关 函数 ， 其 内 容 就 会 被 
重 写 。 

如 果 要 查看 的 只 是 登录 名 或 用 户 ID, 那么 这 两 个 POSIX.1 函数 能 满足 要 求 , 但 是 也 有 些 程序 
要 查看 整个 口令 文件 。 下 列 3 个 函数 则 可 用 于 此 种 目的 。 


#include <pwd.h> 





struct passwd *getpwent (void) ; 


返回 值 : 若 成 功 ， 返 回 指针 ， 若 出 错 或 到 达 文 件 尾 端 ， 返 回 NULL 


void setpwent (void); 





void endpwent (void); 


基本 POSIX.1 标准 没有 定义 这 3 个 函数 。 在 Single UNIX Specification 中 ， 它 们 被 定义 为 XSI 
扩展 。 因 此 ， 可 预期 所 有 UNIX 实现 都 将 提供 这 些 函 数 。 


调用 getpwent 时 , 它 返 回 口令 文件 中 的 下 一 个 记录 项 。 如 同上 面 所 述 的 两 个 POSIX.1 
函数 一 样 ， 它 返回 一 个 由 它 填 写 好 的 passwa 结构 的 指针 。 每 次 调用 此 函数 时 都 重 写 该 结 
构 。 在 第 一 次 调用 该 函数 时 ， 它 打开 它 所 使 用 的 各 个 文件 。 在 使 用 本 函数 时 ， 对 口令 文件 
中 各 个 记录 项 的 安排 顺序 并 无 要 求 。 某 些 系 统 采用 散 列 算法 对 /etc/passwd 文件 中 各 项 
排序 。 

函数 setpwent 反 绕 它 所 使 用 的 文件 ，endpwent 则 关闭 这 些 文件 。 在 使 用 getpwent 查 
看 完 口令 文件 后 , 一 定 要 调用 endpwent 关闭 这 些 文件 。getpwent 知道 什么 时 间 应 当 打 开 它 所 
使 用 的 文件 〈 第 一 次 被 调用 时 )， 但 是 它 并 不 知道 何 时 关闭 这 些 文件 。 


下 实例 
图 6-2 程序 给 出 了 getpwnam 函数 的 一 个 实现 。 


#include <pwd.h> 
#include <stddef.h> 
#include <string.h> 


struct passwd * 
getpwnam(const char *name) 
{ 

struct passwd *ptr; 


setpwent (); 
while ((ptr = getpwent()) != NULL) 
if (strcmp(name, ptr->pw_name) == 0) 
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break; /* found a match */ 
endpwent () ; 
return(ptr); /* ptr is NULL if no match found */ 


图 6-2 getpwnam 函数 
在 函数 开始 处 调用 setpwent 是 自我 保护 性 的 措施 , 以 便 确保 如 果 调 用 者 在 此 之 前 已 经 调用 
getpwent 打开 了 有 关 文 件 情况 下 , 反 绕 有 关 文 件 使 它们 定位 到 文件 开始 处 。 getpwnam 和 getpwuid 
完成 后 不 应 使 有 关 文 件 仍 处 于 打开 状态 ， 所 以 应 调用 endpwent 关闭 它们 。 a 


6.3 ”阴影 口令 


加 密 口 令 是 经 单 向 加 密 算法 处 理 过 的 用 户口 令 副 本 。 因 为 此 算法 是 单 向 的 ， 所 以 不 能 从 加 密 
口令 猜测 到 原来 的 口令 。 

历史 上 使 用 的 算法 总 是 在 64 字符 集 [a-zA-z0-9./] 中 产生 13 个 可 打印 字符 ( 见 Morris 和 
Thompson [1979])。 某 些 较 新 的 系统 使 用 其 他 方法 ， 如 MDS 或 SHA-1 算法 ， 对 口令 加 密 ， 产 生 更 长 的 
加 密 口 令 字符 串 。( 加 密 口令 的 字符 越 多 ， 这 些 字符 的 组 合 也 就 越 多 ， 于 是 用 各 种 可 能 组 合 来 猜测 口令 
的 难度 就 越 大 。) 当 我 们 将 单个 字符 放 在 加 密 口令 字段 中 时 ， 可 以 确保 任 一 加 密 口 令 都 不 会 与 其 相 匹 配 。 

对 于 一 个 加 密 口 令 , 找 不 到 一 种 算法 可 以 将 其 反 变 换 到 明文 口令 (明文 口令 是 在 Password: 
提示 后 键入 的 口令 )。 但 是 可 以 对 口令 进行 猜测 ， 将 猜测 的 口令 经 单 向 算法 变换 成 加 密 形式 ， 然 
后 将 其 与 用 户 的 加 密 口令 相 比 较 。 如 果 用 户口 令 是 随机 选择 的 ， 那 么 这 种 方法 并 不 是 很 有 用 。 但 
是 用 户 往往 以 非 随 机 方式 选择 口令 〈 如 配偶 的 姓名 、 街 名 、 宠 物 名 等 )。 一 个 经 常 重复 的 实验 是 
先 得 到 一 份 口令 文件 ， 然 后 用 试探 方法 猜测 口令 。(Garfinkel 等 [2003] 的 第 4 章 对 UNIX 口令 及 口 
令 加 密 处 理 方 案 的 历史 情况 及 细节 进行 了 说 明 。) 

为 使 企图 这 样 做 的 人 难以 获得 原始 资料 〈 加 密 口 令 )， 现 在 ， 某 些 系统 将 加 密 口 令 存 放 在 另 

-个 通常 称 为 阴影 口令 (shadow password) 的 文件 中 。 该 文件 至 少 要 包含 用 户 名 和 加 密 口 令 。 与 

该 口令 相关 的 其 他 信息 也 可 存放 在 该 文件 中 《〈 图 6-3). 


struct spwd 成 员 


用 户 登 录 名 char *sp_namp 
加 密 口 令 char *sp_pwdp 
上 次 更 改口 令 以 来 经 过 的 时 间 int sp_lstchg 
经 多 少 天 后 允许 更 改 int sp_min 





要 求 更 改 尚 余天 数 i sp_max 

超期 警告 天 数 i sp_warn 

账户 不 活动 之 前 尚 余天 数 i sp_inact 

账户 超期 天 数 i sp_expire 

保留 unsigned int sp_flag 





图 6-3 /etc/shadow 文件 中 的 字段 
只 有 用 户 登 录 名 和 加 密 口 令 这 两 个 字段 是 必须 的 。 其 他 的 字段 控制 口令 更 改 的 频率 ， 或 者 说 
口令 的 衰老 以 及 账户 仍然 处 于 活动 状态 的 时 间 。 
阴影 口令 文件 不 应 是 一 般 用 户 可 以 读 取 的 。. 仅 有 少数 几 个 程序 需要 访问 加 密 口 令 , 如 login(]) 
和 passwqd(1)， 这 些 程序 常常 是 设置 用 户 ID 为 root 的 程序 。 有 了 阴影 口令 后 ， 普 通 口令 文件 


146 第 6 章 系统 数据 文件 和 信息 


/etc/passwd 可 由 各 用 户 自 由 读 取 。 
在 Linux 3.2.0 和 Solaris 10 中 ， 与 访问 口令 文件 的 一 组 函数 相 类 似 ， 有 男 一 组 函数 可 用 于 访 
问 阴影 口令 文件 。 


#include <shadow.h> 


struct spwd *getspnam(const char *name); 


struct spwd *getspent (void); 
两 个 函数 返回 值 : 若 成 功 ， 返 回 指针 ; 若 出错 ， 返 回 NULL 


void setspent (void) ; 





void endspent (void) ; 


在 FreeBSD 8.0 fll Mac OS X 10.6.8 F, 没有 阴影 口令 结构 。 附 加 的 账户 信息 存放 在 口令 文件 
中 ( 见 图 6-1)。 


6.4 组 文件 


UNIX 组 文件 (POSIX.1 称 其 为 组 数据 库 ) 包 含 了 图 6-4 中 所 示 字 段 。 这 些 字 段 包含 在 <grp .hy> 
中 所 定义 的 group 结构 中 。 


| *gr_name 
Medi char *gr passwd 
数值 组 ID int gr_gid 
te char **gr_mem 


图 6-4 /etc/group 文件 中 的 字段 


字段 gr. mem 是 一 个 指针 数组 , 其 中 每 个 指针 指向 一 个 属于 该 组 的 用 户 名 。 该 数组 以 null 指针 结尾 
可 以 用 下 列 两 个 由 POSIX.1 定义 的 函数 来 查看 组 名 或 数值 组 ID。 


#include <grp.h> 





struct group *getgrgid(gid t gid); 
struct group *getgrnam(const char *name) ; 
两 个 函数 返回 值 ， 基 成功， 返回 指针 ， 若 出 错 ， 返 回 NULL 
如 同 对 口令 文件 进行 操作 的 函数 一 样 ， 这 两 个 函数 通常 也 返回 指向 一 个 静态 变量 的 指针 ， 在 
每 次 调用 时 都 重 写 该 静态 变量 。 
如 果 需 要 搜索 整个 组 文件 ， 则 须 使 用 另外 几 个 函数 。 下 列 3 个 函数 类 似 于 针对 口令 文件 的 3 
个 函数 。 


#include <grp.h> 





struct group *getgrent (void); 


返回 值 : 若 成 功 ， 返 回 指针 ; 若 出 错 或 到 达 文 件 尾 端 ， 返 回 NULL 


void setgrent (void); 





void endgrent (void); 


这 3 个 函数 不 是 基本 POSIX.1 标准 的 组 成 部 分 。Single UNIX Specification 的 XSI 扩展 定义 了 
这 些 函 数 。 所 有 UNIX 系统 都 提供 这 3 个 函数 。 
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setgrent 函数 打开 组 文件 (如若 它 尚未 被 打开 ) 并 反 绕 它 。getgrent 函数 从 组 文件 中 读 
下 一 个 记录 ， 如 车 该 文件 尚未 打开 ， 则 先 打 开 它 。endgrent 函数 关闭 组 文件 。 


6.5 附属 组 ID 


在 UNIX 系统 中 ， 对 组 的 使 用 已 经 做 了 些 更 改 。 在 V7 中 ， 每 个 用 户 任何 时 候 都 只 属于 一 个 
组 。 当 用 户 登 录 时 ， 系 统 就 按 口令 文件 记录 项 中 的 数值 组 ID， 赋 给 他 实际 组 ID。 可 以 在 任何 时 
候 执行 newgrp(1) 以 更 改组 ID. WR newgrp 命令 执行 成 功 ( 关 于 权限 规则 ， 请 参阅 手册 )， 则 
实际 组 ID 就 更 改 为 新 的 组 ID， 它 将 被 用 于 后 续 的 文件 访问 权限 检查 。 执 行 不 带 任何 参数 的 
newgrp， 则 可 返回 到 原来 的 组 。 

这 种 组 成 员 形式 一 直 维 持 到 1983 年 左右 .此 时 ,4.2BSD 引入 了 附属 组 ID(supplementary group 
ID) 的 概念 。 我 们 不 仅 可 以 属于 口令 文件 记录 项 中 组 ID 所 对 应 的 组 ， 也 可 属于 多 至 16 个 另外 的 
组 。 文件 访问 权限 检查 相应 被 修改 为 :不仅 将 进程 的 有 效 组 ID 与 文件 的 组 ID 相 比 较 ， 而 且 也 将 
所 有 附属 组 ID 与 文件 的 组 ID 进行 比较 。 


附属 组 ID 是 POSIX.1 要 求 的 特性 。( 在 较 早 的 POSIX.1 版 本 中 ， 该 特性 是 可 选 的 。) 常量 
| NGROUPS MAX ( 见 图 2-11) 规定 了 附属 组 ID 的 数量 ， 其 常用 值 是 16 (LBS 2-15 )。 


使 用 附属 组 ID 的 优点 是 不 必 再 显 式 地 经 常 更 改组 。 一 个 用 户 会 参与 多 个 项 目 ， 因 此 也 就 要 
同时 属于 多 个 组 ， 此 类 情况 是 常 有 的 。 
为 了 获取 和 设置 附属 组 ID， 提 供 了 下 列 3 个 函数 。 
#include <unistd.h> 
int getgroups (int gidsetsize, gid t grouplist(]) ; 
返回 值 : 车 成 功 ， 返 回 附属 组 ID 数量 ， 若 出 错 ， 返 回 -1 


#include <grp.h> /* on Linux */ 


#include <unistd.h> /* on FreeBSD, Mac OS X, and Solaris */ 


int setgroups(int ngroups, const gid t grouplist[]) ; 


#include <grp.h> /* on Linux and Solaris */ 
#include <unistd.h> /* on FreeBSD and Mac OS X */ 
int initgroups(const char *username, gid t basegid); 
两 个 函数 的 返回 值 : FRH, RE 0; 若 出 错 ， 返 回 -1 
在 这 3 个 函数 中 ，POSIX.1 只 说 明了 getgroups。 因 为 setgroups 和 initgroups 是 特 
权 操 作 ， 所 以 它们 并 非 POSIX.1 的 组 成 部 分 。 但 是 ， 本 书 说 明 的 所 有 4 种 平台 都 支持 这 3 个 函数 。 
Æ Mac OS X 10.6.8 中 ，basegid 被 声明 为 int 类 型 。 


getgroups 将 进程 所 属 用 户 的 各 附属 组 ID 填写 到 数组 grouplist P, 填写 入 该 数组 的 附属 组 
ID 数 最 多 为 gidsetsize 个 。 实 际 填写 到 数组 中 的 附属 组 ID 数 由 函数 返回 。 

作为 一 种 特殊 情况 ， 如 若 gidsetsize 为 0， 则 函数 只 返回 附属 组 ID 数 ， 而 对 数组 grouplist W 
不 做 修改 。( 这 使 调用 者 可 以 确定 grouplist 数组 的 长 度 ， 以 便 进行 分 配 。) 

setgroups 可 由 超级 用 户 调用 以 便 为 调用 进程 设置 附属 组 ID 表 。grouplist 是 组 ID 数组 ， 
而 ngroups 说 明了 数组 中 的 元 素数 。ngroups 的 值 不 能 大 于 NGROUPS MAX. 

通常 ， 只 有 initgroups 函数 调用 setgroups, initgroups 读 整 个 组 文件 (用 前 面 说 明 
的 函数 getgrent. setgrent 和 endgrent)， 然 后 对 username 确定 其 组 的 成 员 关 系 。 然 后 ， 
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它 调用 setgroups, 以 便 为 该 用 户 初始 化 附属 组 ID 表 。 因 为 initgroups 要 调用 setgroups， 
所 以 只 有 超级 用 户 才能 调用 initgroups。 除 了 在 组 文件 中 找到 username 是 成 员 的 所 有 组 ， 
initgroups 也 在 附属 组 ID 表 中 包括 了 basegid. basegid 是 username 在 口令 文件 中 的 组 ID. 

只 有 少数 几 个 程序 调用 initgroups， 例 如 1ogin(1) 程 序 在 用 户 登 录 时 调用 该 函数 。 


6.6 ”实现 区 别 


我 们 已 讨论 了 Linux 和 Solaris 支持 的 阴影 口令 文件 。FreeBSD 和 Mac OS X 则 以 不 同方 式 存 
储 加 密 口令 字 。 图 6-5 总 结 了 本 书 涉及 的 4 种 平台 如 何 存储 用 户 和 组 信息 。 


账户 信息 /etc/passwd /etc/passwd /etc/passwd 
加 密 口令 

是 否 是 散 列 口令 文件 ? 
组 信息 





















/etc/master.passwd | /etc/shadow /etc/shadow 

是 fi fi 

/etc/group /etc/group /etc/group 
图 6-5 ”账户 实现 的 区 别 

在 FreeBSD 中 ， 阴 影 口 令 文件 是 /etc/master.passwd。 可 以 使 用 特殊 命令 编辑 该 文件 ， 
它 会 从 阴影 口令 文件 产生 /etc/passwd 的 一 个 副本 。 另 外 ， 也 产生 该 文件 的 散 列 副本 。 
/etc/pwd.db 是 /etc/passwd 的 散 列 副 本 , /etc/spwd.db #/etc/master.passwd 的 散 
列 版 本 。 这 些 为 大 型 安装 的 系统 提供 了 更 好 的 性 能 。 

但 是 ，Mac OS X 只 在 单 用 户 模式 下 使 用 /etc/passwd 和 /etc/master .passwd〔 在 维护 
系统 时 ， 单 用 户 模式 通常 意味 着 不 能 提供 任何 系统 服务 )。 在 正常 运行 期 间 的 多 用 户 模 式 ， 目 录 
服务 守护 进程 提供 对 用 户 和 组 账户 信息 的 访问 。 

虽然 Linux 和 Solaris 支持 类 似 的 阴影 口令 接口 ， 但 两 者 之 间 存 在 某 些 细微 的 差别 。 例 如 ， 图 
6-3 中 所 示 的 整数 字段 在 Solaris 中 定义 为 int 类 型 ， 而 在 Linux 中 则 定义 为 long int。 男 一 个 
差别 是 账户 -不 活动 字段 : Solaris 将 其 定义 为 自用 户 上 次 登录 后 到 下 次 账户 自动 失效 之 间 的 天 数 ， 
而 Linux 则 将 其 定义 为 达到 最 大 口令 年 龄 尚 余天 数 。 

在 很 多 系统 中 ,用 户 和 组 数据 库 是 用 网 络 信息 服务 (Network Information Service, NIS) 实现 
的 。 这 使 管理 人 员 可 编辑 数据 库 的 主 副本 ， 然 后 将 它 自动 分 发 到 组 织 中 的 所 有 服务 器 上 。 客 户 端 
系统 联系 服务 器 以 查看 用 户 和 组 的 有 关 信 息 。NIS+ 和 轻 量 级 目录 访问 协议 (Lightweight Directory 
Access Protocol，LDAP) 提供 了 类 似 功 能 。 很 多 系统 通过 配置 文件 /etc/nsswitch.conf 控制 
用 于 管理 每 一 类 信息 的 方法 。 


6.7 ”其 他 数据 文件 
至 此 仅 讨 论 了 两 个 系统 数据 文件 一 口令 文件 和 组 文件 。 在 日 常 操作 中 ，UNIX 系统 还 使 用 很 多 


其 他 文件 .例如 ,BSD 网 络 软件 有 一 个 记录 各 网 络 服务 器 所 提供 服务 的 数据 文件 (/etc/services)， 
有 一 个 记录 协议 信息 的 数据 文件 (/etc/protocols )， 还 有 一 个 则 是 记录 网 络 信息 的 数据 文件 






(/etc/networks)。 幸 运 的 是 ， 对 于 这 些 数 据 文件 的 接口 都 与 上 述 对 口令 文件 和 组 文件 的 相似 。 


- 般 情 况 下 ， 对 于 每 个 数据 文件 至 少 有 3 个 函数 。 
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(D get 函数 : 读 下 一 个 记录 ， 如 果 需 要 ， 还 会 打开 该 文件 。 此 种 函数 通常 返回 指向 一 个 结 
构 的 指针 。 当 已 达到 文件 尾 端 时 返回 空 指 针 。 大 多 数 get 函数 返回 指向 一 个 静态 存储 类 结构 的 指 
针 ， 如 果 要 保存 其 内 容 ， 则 需 复 制 它 。 

(2) set 函数 : 打开 相应 数据 文件 (如 果 尚 末 打 开 )， 然 后 反 绕 该 文件 。 如 果 希 望 在 相应 文 
件 起 始 处 开始 处 理 ， 则 调用 此 函数 。 

(3) end 函数 : 关闭 相应 数据 文件 。 如 前 所 述 ， 在 结束 了 对 相应 数据 文件 的 读 、 写 操作 后 ， 
总 应 调用 此 函数 以 关闭 所 有 相关 文件 。 

另外 ,如 果 数 据 文件 支持 某 种 形式 的 键 搜索 ,， 则 也 提供 搜索 具有 指定 键 的 记录 的 例 程 。 例 如 ， 
对 于 口令 文件 ， 提 供 了 两 个 按键 进行 搜索 的 程序 : getpwnam 寻找 具有 指定 用 户 名 的 记录 : 
getpwuid 寻找 具有 指定 用 户 ID 的 记录 。 

图 6-6 中 列 出 了 一 些 这 样 的 例 程 ， 这 些 都 是 UNIX 常用 的 。 在 图 中 列 出 了 针对 口令 文件 和 组 
文件 的 函数 ， 这 些 已 在 前 面 说 明 过 。 图 中 也 列 出 了 一 些 与 网 络 有 关 的 函数 。 对 于 图 中 列 出 的 所 有 
数据 文件 都 有 get. set 和 end 函数 。 


tae | <pwd.h> passwd getpwnam. getpwuid 





/etc/group <grp.h> group getgrnam, getgrgid 
/etc/shadow «shadow.h» spwd getspnam 


/etc/hosts <netdb.h> hostent getnameinfo. getaddrinfo 
/etc/networks «netdb.h» netent getnetbyname. getnetbyaddr 


/etc/protocols «netdb.h» protoent Getprotobyname. getprotobynumber 





/etc/services «netdb.h» servent getservbyname. getservbyport 


图 6-6 访问 系统 数据 文件 的 一 些 例 程 


在 Solaris 中 ， 图 6-6 中 的 最 后 4 个 数据 文件 都 是 符号 链接 ， 它 们 都 链接 到 目录 /etc/inet 
下 的 同名 文件 上 。 大 多 数 UNIX 系统 实现 都 有 类 似 于 图 中 所 列 的 附加 邓 数 ， 但 是 这 些 附 加 函数 都 
旨 在 处 理 系统 管理 文件 ， 专 用 于 各 个 实现 。 


6.8 登录 账户 记录 


大 多 数 UNIX 系统 都 提供 下 列 两 个 数据 文件 ，utmp 文件 记录 当前 登录 到 系统 的 各 个 用 户 ，wtmp 
文件 跟踪 各 个 登录 和 注销 事件 ,在 V7 中 , 每 次 写 入 这 两 个 文件 中 的 是 包含 下 列 结构 的 一 个 二 进 制 记录 : 


struct utmp { 


char ut line[8]; /* tty line: "ttyh0", "ttydO0", "ttypO", ... */ 
char ut name[8]; /* login name */ 
long ut time; /* seconds since Epoch */ 


E; 

登录 时 ，1login 程序 填写 此 类 型 结构 ， 然 后 将 其 写 入 到 utmp 文件 中 ， 同 时 也 将 其 添 写 到 
wtmp 文件 中 。 注销 时 ，init 进程 将 utmp 文件 中 相应 的 记录 擦 除 (每 个 字 节 都 填 以 null FH), 
并 将 一 个 新 记录 添 写 到 wtmp 文件 中 。 在 wtmp 文件 的 注销 记录 中 ，ut_name 字段 清除 为 0。 在 
系统 再 启动 时 , 以 及 更 改 系统 时 间 和 日 期 的 前 后 , 都 在 wtmp 文件 中 追加 写 特殊 的 记录 项 。 who(1) 
程序 读 取 utmp 文件 , 并 以 可 读 格 式 打印 其 内 容 。 后 来 的 UNIX 版 本 提供 last(1) 命 令 , 它 读 wtmp 
文件 并 打印 所 选择 的 记录 。 
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大 多 数 UNIX 版 本 仍 提 供 utmp 和 wtmp 文件 ， 但 正如 所 期 望 的 ， 其 中 的 信息 量 却 增加 了 。YV7 中 
写 入 的 20 字 节 的 结构 在 SVR2 中 已 扩充 为 36 字 节 , 而 在 SVR4 中 , utmp 结构 已 扩充 为 多 于 350 字 节 。 
在 Solaris 中 ， 这 些 记录 的 详细 格式 请 参见 手册 页 utmpx(4)。Solaris 10 中 这 两 个 文件 都 在 目 
X/var/adm P. Solaris 提供 了 很 多 函数 ( JU getutx(3) ) 读 或 写 这 两 个 文件 。 
在 FreeBSD 8.0 和 Linux 3.2.0 中 , 登录 记录 的 格式 请 参见 手册 页 utmp(5). 这 两 个 文件 的 路 径 
名 是 /var/run/utmp 和 /var/log/wtmp。 在 MacOSX 10.6.8 中 , utmp 和 wtmp 文件 不 存在 。 
在 Mac OS X 10.5 中 ，wtmp 文件 中 的 信息 可 以 从 系统 登录 工具 中 获得 ，utmpx 文件 包含 了 活动 
的 登录 会 话 的 信息 。 


6.9 ”系统 标识 


POSIX.1 定义 了 uname 函数 ， 它 返回 与 主机 和 操作 系统 有 关 的 信息 。 


#include <sys/utsname.h> 


int uname (struct utsname *name); 





返回 值 : 若 成 功 ， 返 回 非 负 值 ， 若 出 错 ， 返 回 -1 


通过 该 函数 的 参数 向 其 传递 一 个 utsname 结构 的 地 址 ， 然 后 该 函数 填写 此 结构 。POSIX .1 
只 定义 了 该 结构 中 最 少 需 提供 的 字段 〈 它 们 都 是 字符 数组 )， 而 每 个 数组 的 长 度 则 由 实现 确定 。 
某 些 实现 在 该 结构 中 提供 了 另外 一 些 字段 。 


struct utsname { 


char sysname[ ]; /* name of the operating system */ 

char nodename[ ]; /* name of this node */ 

char release[ ]; /* current release of operating system */ 
char version[ ]; /* current version of this release */ 
char machine[ ]; /* name of hardware type */ 


i 
每 个 字符 串 都 以 null 字 节 结尾 。 本 书 讨论 的 4 种 平台 支持 的 最 大 名 字 长 度 (包含 终止 null 字 
节 ) 列 于 图 6-7 中 。utsname 结构 中 的 信息 通常 可 用 uname(1) 命 令 打印 。 
POSIX.1 警告 nodename 元 素 可 能 并 不 适用 于 在 通信 网 络 上 引用 主机 。 此 函数 来 自 于 System 
V， 在 早期 ，nodename 元 素 适 用 于 在 UUCP 网 络 上 引用 主机 。 
还 要 认识 到 ， 在 此 结构 中 并 没有 给 出 有 关 POSIX.1 版 本 的 信息 。 应 当 使 用 2.6 节 中 所 说 明 的 
_POSIX_VERSION 获得 该 信息 。 
最 后 ， 此 函数 只 给 出 了 一 种 获取 该 结构 中 信息 的 方法 ， 至 于 如 何 初 始 化 这 些 信 息 ，POSIX.1 
没有 给 出 任何 说 明 。 
历史 上 ,BSD 派生 的 系统 提供 gethostname 函数 , 它 只 返回 主机 名 ,该 名 字 通 常 就 是 TCP/IP 
网 络 上 主机 的 名 字 。 


#include <unistd.h> 


int gethostname (char *name, int namelen) ; 





返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


namelen 参数 指定 name 缓冲 区 长 度 , 如 若 提供 足够 的 空间 , 则 通过 name 返回 的 字符 串 以 null 
字 节 结尾 。 如 若 没 有 提供 足够 的 空间 ， 则 没有 说 明 通 过 name 返回 的 字符 串 是 否 以 null 结尾 。 
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现在 ,gethostname 函数 已 在 POSIX.1 中 定义 , 它 指定 最 大 主机 名 长 度 是 HOST_NAME_MAX。 
图 6-7 中 总 结 列 出 了 本 书 讨论 的 4 种 实现 支持 的 最 大 名 字 长 度 。 














最 大 名 字 长 度 


FreeBSD 8.0 Linux 3.2.0 Mac OS X 10.6.8 | Solaris 10 | 


uname 256 65 256 257 
Eel RE Ix - X: 
图 6-7 系统 标识 名 限制 

如 果 宿 主机 联接 到 TCP/IP 网 络 中 ， 则 此 主机 名 通常 是 该 主机 的 完整 域名 。 


hostname(1) 命 令 可 用 来 获取 和 设置 主机 名 。( 超 级 用 户 用 一 个 类 似 的 函数 sethostname 
来 设置 主机 名 。) 主机 名 通常 在 系统 自 举 时 设置 ， 它 由 /etc/rc 或 init 取 自 一 个 启动 文件 。 
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由 UNIX 内 核 提 供 的 基本 时 间 服 务 是 计算 自 协调 世界 时 (Coordinated Universal Time, UTC) 
公元 1970 年 1 月 1 H 00:00:00 这 一 特定 时 间 以 来 经 过 的 秒 数 。1.10 节 中 曾 提 及 这 种 秒 数 是 以 数 
据 类 型 time t 表示 的 ， 我 们 称 它们 为 日 历时 间 。 日 历时 间 包 括 时 间 和 日 期 。UNIX 在 这 方面 与 
其 他 操作 系统 的 区 别 是 : Ca) 以 协调 统一 时 间 而 非 本 地 时 间 计 时 ; (b) 可 自动 进行 转换 ， 如 变换 
到 夏令 时 ，(c) 将 时 间 和 日 期 作为 一 个 量 值 保存 。 

time 函数 返回 当前 时 间 和 日 期 。 
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#include <time.h> 


time t time(time t *calptr); 





返回 值 : 若 成 功 ， 返 回 时 间 值 ， 若 出 错 ， 返 回 -1 
时 间 值 作为 函数 值 返回 。 如 果 参 数 非 室 ， 则 时 间 值 也 存放 在 由 calptr 指向 的 单元 内 。 
POSXI.1 的 实时 扩展 增加 了 对 多 个 系统 时 钟 的 支持 。 在 Single UNIX Specification V4 中 ,控制 这 
些 时 钟 的 接口 从 可 选 组 被 移 至 基本 组 。 时 钟 通过 clockid_t 类 型 进行 标识 。 图 6-8 给 出 了 标准 值 。 


CLOCK_REALTIME 实时 系统 时 间 
CLOCK_MONOTONIC _POSIX_MONOTONIC_CLOCK 不 带 负 跳 数 的 实时 系统 时 间 
CLOCK_PROCESS_CPUTIME_ID | _POSIX_CPUTIME 调用 进程 的 CPU 时 间 
CLOCK_THREAD_CPUTIME_ID _POSIX_THREAD_CPUTIME 调用 线程 的 CPU 时 间 


图 6-8 时钟 类 型 标识 符 
clock gettime 函数 可 用 于 获取 指定 时 钟 的 时 间 ， 返 回 的 时 间 在 4.2 节 介 绍 的 timespec 
结构 中 ， 它 把 时 间 表 示 为 秒 和 纳 秒 。 


#include <sys/time.h> 








int clock_gettime(clockid_t clock id, struct timespec *tsp); 
返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 
当时 钟 ID 设置 为 CLOCK REALTIME 时 , clock gettime 函数 提供 了 与 上 time 函数 类 似 的 功能 ， 
不 过 在 系统 支持 高 精度 时 间 值 的 情况 下 ，clock_gettime 可 能 比 time 函数 得 到 更 高 精度 的 时 间 值 。 
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#include <sys/time.h> 


int clock getres(clockid t clock id, struct timespec *fsp); 
返回 值 ， 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 
clock getres 函数 把 参数 tsp 指向 的 timespec 结构 初始 化 为 与 clock 这 参数 对 应 的 时 钟 
精度 。 例 如 ， 如 果 精 度 为 1 毫秒 ， 则 tv sec 字段 就 是 0，tv_nsec 字段 就 是 1 000000. 
要 对 特定 的 时 钟 设置 时 间 ， 可 以 调用 clock settime 函数 。 


#include <sys/time.h> 





int clock settime(clockid t clock id, const struct timespec *ésp); 
返回 值 ， 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 
我 们 需要 适当 的 特权 来 更 改 时 钟 值 ， 但 是 有 些 时 钟 是 不 能 修改 的 。 
Mt, Æ System V 派生 的 系统 实现 中 ， 调 用 stime(2) 函 数 来 设置 系统 时 间 ， 而 在 BSD 派 
生 的 系统 中 调用 settimeofday(2) 设 置 系统 时 间 。 





SUSv4 指定 gettimeofday 函数 现在 已 弃 用 。 然 而 ， 一 些 程序 仍然 使 用 这 个 函数 ， 因 为 与 
time 函数 相 比 ，gettimeofday 提供 了 更 高 的 精度 (可 到 微 秒 级 )。 


#include <sys/time.h> 


int gettimeofday(struct timeval *restrict tp, void *restrict tzp); 





返回 值 ， 总 是 返回 0 

tzp 的 唯一 合法 值 是 NULL， 其 他 值 将 产生 不 确定 的 结果 。 某 些 平台 支持 用 tzp 说 明 时 区 ， 但 
这 完全 依 实现 而 定 ，Single UNIX Specification 对 此 并 没有 定义 。 

gettimeofday 函数 以 距 特定 时 间 (1970 年 1 月 1 日 00:00:00) 的 秒 数 的 方式 将 当前 时 
间 存 放 在 加 指向 的 timeval 结构 中 ， 而 该 结构 将 当前 时 间 表 示 为 秒 和 微 秒 。 

一 旦 取得 这 种 从 上 述 特 定时 间 经 过 的 秒 数 的 整 型 时 间 值 后 , 通常 要 调用 函数 将 其 转换 为 分 解 的 
时 间 结 构 ， 然 后 调用 男 一 个 函数 生成 人 们 可 读 的 时 间 和 日 期 。 图 6-9 说 明了 各 种 时 间 函 数 之 间 的 关 
系 ,( 图 中 以 虚线 表示 的 3 个 函数 localtime、mktime 和 strftime 都 受到 环境 变量 Tz 的 影响 ， 

我 们 将 在 本 节 的 最 后 部 分 对 其 进行 说 明 。 点 划 线 表示 了 如 何 从 时 间 相 关 的 结构 获得 日 历时 间 。) 
两 个 函数 Localtime 和 gmtime 将 日 历时 间 转 换 成 分 解 的 时 间 ， 并 将 这 些 存放 在 一 个 tm 结构 中 。 


struct tm { /* a broken-down time */ 
int tm_sec; /* seconds after the minute: [0 - 60] */ 
int tm_min; /* minutes after the hour: [0 - 59] */ 
int tm_hour; /* hours after midnight: [0 - 23] */ 
int tm_mday; /* day of the month: [1 - 31] */ 
int tm_mon; /* months since January: [0 - 11] */ 
int tm_year; /* years since 1900 */ 
int tm_wday; /* days since Sunday: [0 - 6] */ 
int tm_yday; /* days since January 1: [0 - 365] */ 
int tm_isdst; /* daylight saving time flag: «0, 0, >0 */ 


E 
秒 可 以 超过 59 的 理由 是 可 以 表示 润 秒 。 注 意 ， 除 了 月 日 字段 ， 其 他 字段 的 值 都 以 0 开始 。 如 果 夏 令 
时 生效 ， 则 夏令 时 标志 值 为 正 ， 如果 为 非 夏令 时 时 间 ， 则 该 标志 值 为 0; 如 果 此 信息 不 可 用 ， 则 其 值 为 负 。 
Single UNIX Specification 的 以 前 版 本 允许 双 润 秒 ， 于 是 ，tm_sec 值 的 有 效 范 围 是 0~61。 
UTC 的 正式 定义 不 允许 双 润 秒 ， 所 以 ， 现 在 tm sec 值 的 有 效 范 围 定义 为 0~ 60。 


6.10 ”时间 和 日 期 例 程 153 








格式 化 字符 串 
















[3 
$ localtime 
rt 

Ui 


mæ- 














"sec "| (nag) sec 





gettimeofday time 


内 核 
图 6-9 各 个 时 间 函 数 之 间 的 关系 
#include <time.h> 
struct tm *gmtime(const time t *calptr); 
struct tm *localtime(const time t *calptr); 
两 个 函数 的 返回 值 : 指向 分 解 的 cm 结构 的 指针 ;， 若 出 错 ， 返 回 NULL 

localtime 和 gmtime 之 间 的 区 别 是 : localtime 将 日 历时 间 转 换 成 本 地 时 间 (考虑 到 本 
地 时 区 和 夏令 时 标志 )， 而 gmtime 则 将 日 历时 间 转 换 成 协调 统一 时 间 的 年 、 月 、 日 、 时 、 分 、 
秒 、 周 日 分 解 结构 。 

函数 mktime 以 本 地 时 间 的 年 、 月 、 日 等 作为 参数 ， 将 其 变换 成 上 time t 值 。 


#include <time.h> 





time t mktime(struct tm *fmptr); 





返回 值 ， 若 成 功 ， 返 回 日 历时 间 ， 若 出 错 ， 返 回 -1 
函数 strftime 是 一 个 类 似 于 printf 的 时 间 值 函数 。 它 非常 复杂 ,可 以 通过 可 用 的 多 个 参 


数 来 定制 产生 的 字符 串 。 


#include <time.h> 









size_t strftime(char *restrict buf, size_t maxsize, 
const char *restrict format, 
const struct tm *restrict tmptr); 











size t strftime l(char *restrict buf, size t maxsize, 
const char *restrict format, 
const struct tm *restrict fmptr, locale t locale); 


两 个 函数 的 返回 值 : 若 有 空间 ， 返 回 存 入 数组 的 字符 数 ; 否则， 返回 0 






两 个 较 早 的 函数 一 asctime 和 ctime 能 用 于 产生 一 个 26 字 节 的 可 打印 的 字符 串 , 类 似 于 
date(]) 命 令 默认 的 和 输出。 然而, 这些 函数 现在 已 经 被 标记 为 齐 用 ,因为 它们 易 受 到 缓冲 区 溢出 问 
题 的 影响 。 


strftime 1 人 允许 调用 者 将 区 域 指定 为 参数 ， 除 此 之 外 ，strftime 和 strftime_1 函数 
是 相同 的 。strftime 使 用 通过 Tz 环境 变量 指定 的 区 域 。 
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tmptr 参数 是 要 格式 化 的 时 间 值 ， 由 一 个 指向 分 解 时 间 值 tm 结构 的 指针 说 明 。 格 式 化 结果 存 
放 在 一 个 长 度 为 maxsize 个 字符 的 buf 数组 中 , 如 果 buf 长 度 足 以 存放 格式 化 结果 及 一 个 null 终止 
符 ， 则 该 函数 返回 在 buf 中 存放 的 字符 数 〈 不 包括 null 终止 符 )， 否 则 该 函数 返回 0。 
format 参数 控制 时 间 值 的 格式 。 如 同 printf 函数 一 样 ， 转 换 说 明 的 形式 是 百 分 号 之 后 跟 一 
个 特定 字符 。format 中 的 其 他 字符 则 按 原 样 输出 。 两 个 连续 的 百 分 号 在 输出 中 产生 一 个 百 分 号 。 
5 printf 函数 的 不 同 之 处 是 ， 每 个 转换 说 明 产 生 一 个 不 同 的 定 长 输出 字符 串 , E format 字符 串 
中 没有 字段 宽度 修饰 符 。 图 6-10 中 列 出 了 37 种 ISO C 规定 的 转换 说 明 。 





缩写 的 周 日 名 Thu 

全 周 日 名 Thursday 
缩写 的 月 名 Jan 

全 月 名 January 
日 期 和 时 间 Thu Jan 19 21:24:52 2012 
年 /100 (00~99) 20 

月 日 〈01 一 31) 19 

H# (MM/DD/YY) 01/19/12 
月 日 〈 一 位 数字 前 加 空格 ) (1 一 31) 19 

ISO 8601 日 期 格式 CYYYY-MM-DD) 2012-01-19 
ISO 8601 基于 周 的 年 的 最 后 2 位 数 (00—99) 12 

ISO 8601 基于 周 的 年 2012 
与 $b 相同 Jan 

小 时 (24 小 时 制 ) C00—23) 21 

小 时 (12 小 时 制 ) (01 一 12) 09 

年 日 (001 一 366) 019 

月 (01 一 12) 01 

分 (00—59) 24 

换行 符 

AM/PM 

本 地 时 间 C12 小 时 制 ) :24:52 PM 
与 “%H:%M” 相 同 :24 

秒 : [00-60] 

与 “%H:%M:%S” 相 同 

ISO 8601 周 几 (Monday=1, 1 一 7) 

星期 日 周 数 : (00 一 53) 

ISO 8601 周 数 : (01 一 53) 

周 几 : (0=Sunday, 0 一 6) 

星期 一 周 数 : (00—53) 

本 地 日 期 01/19/12 
本 地 时 间 21:24:52 
年 的 最 后 两 位 数字 (00~99) 12 

年 2012 

ISO 8601 格式 的 UTC 偏 移 量 -0500 

时 区 名 EST 
翻译 为 1 个 % $ 


图 6-10 strftime 的 转换 说 明 
图 中 第 3 列 的 数据 来 自 于 在 Mac OS X 中 执行 strftime 函数 所 得 的 结果 ， 它 对 应 的 时 间 和 
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日 期 是 : Thu Jan 19 21:24:52 EST 2012。 
图 6-10 中 的 大 多 数 格式 说 明 的 意义 很 明显 。 需 要 略 做 解释 的 是 sU、#sV 和 s%W。s%U 是 相 


应 日 期 在 该 年 中 所 属 周 数 ， 包 含 该 年 中 第 一 个 星期 日 的 周 是 第 一 周 。sWw 也 是 相应 日 期 在 该 


年 中 所 属 的 周 数 ， 不 同 的 是 包含 第 一 个 星期 一 的 周 为 第 一 周 。sV 说 明 符 则 与 上 述 两 者 有 较 
大 区 别 。 如果 包含 了 1 月 1 日 的 那 一 周 包 含 了 新 一 年 的 4 天 或 更 多 天 , 那么 该 周 是 一 年 中 的 
第 一 周 ; 和 否则 该 周 被 认为 是 上 一 年 的 最 后 一 周 。 在 这 两 种 情况 下 ， 周 一 都 被 视 作 每 周 的 第 
一 天 。 
lh] printf —ff, strftime 对 某 些 转换 说 明 支 持 修 饰 符 。 可 以 使 用 己 和 o 修饰 符 产 生 本 地 
支持 的 另 一 种 格式 。 


某 些 系统 对 strftime 的 format 字符 串 提供 另 一 些 非 标准 的 扩充 支持 。 


m Xi 
图 6-11 演示 了 如 何 使 用 本 章 中 讨论 的 多 个 时 间 函 数 。 特 别 演示 了 如 何 使 用 strftime 打印 
包含 当前 日 期 和 时 间 的 字符 串 。 


#include <stdio.h> 
#include <stdlib.h> 
#include <time.h> 


int 

main (void) 

{ 
time_t t; 
struct tm *tmp; 
char buf1[16]; 
char buf2[64]; 


time (&t); 

tmp = localtime(&t); 

if (strftime(bufl, 16, "time and date: $r, $a $b $d, $Y", tmp) == 0) 
printf("buffer length 16 is too small\n"); 

else 
printf ("%$s\n", bufl); 

if (strftime(buf2, 64, "time and date: $r, $a tb td, $Y", tmp) == 0) 
printf("buffer length 64 is too small\n"); 

else 
printf("%s\n", buf2); 

exit(0); 


图 6-11 使 用 strftime 函数 
回顾 图 6-9 中 的 不 同时 间 函 数 的 关系 。 在 以 人 们 可 读 的 格式 打印 时 间 之 前 ， 需 要 获取 时 间 并 
将 其 转换 成 分 解 的 时 间 结 构 。 图 6-11 程序 的 输出 如 下 : 


$ ./a.out 
buffer length 16 is too small 
time and date: 11:12:35 PM, Thu Jan 19, 2012 


strptime MALE strftime 的 反 过 来 版 本 ， 把 字符 串 时 间 转 换 成 分 解 时 间 。 


156 第 6 章 系统 数据 文件 和 信息 


#include <time.h> 


char *strptime(const char *restrict buf, const char *restrict format, 


struct tm *restrict tfmptr); 
返回 值 : 指向 上 次 解析 的 字符 的 下 一 个 字符 的 指针 ， 否 则 ， 返 回 NULL 


format 参数 给 出 了 buf 参数 指向 的 缓冲 区 内 的 字符 串 的 格式 。 虽 然 与 strftime 函数 的 说 明 
稍 有 不 同 ， 但 格式 说 明 是 类 似 的 。strptime 函数 转换 说 明 符 列 在 图 6-12 中 。 





缩写 的 或 完整 的 周 日 名 
与 sa 相同 
缩写 的 或 完整 的 月 名 
与 $b 相同 
日 期 和 时 间 
年 的 最 后 两 位 数字 
月 日 : [01-31] 
日 期 [MM/DD/YY] 
与 $d 相同 
与 $b 相同 
小 时 (24 小 时 制 ): [00-23] 
小 时 (12 小 时 制 ): [01-12] 
年 日 : [001-366] 
H: [01-12] 
分 : [00-59] 
任何 空白 
AM/PM 
本 地 时 间 : C12 小 时 制 ) 
与 “%H:%M” 相 同 
秒 : [00-60] 
任何 空白 
与 “%H:%M:$S” 相 同 
星期 日 周 数 : [00-53] 
周 日 : [0=Sunday, 0-6] 
星期 一 周 数 : [00-53] 
本 地 日 期 
本 地 时 间 
年 的 最 后 两 位 数字 : [00-99] 
年 
翻译 为 1 个 % 
6-12 strptime 函数 的 转换 说 明 
我 们 曾 在 前 面 提 及 ， 图 6-9 中 以 虚线 表示 的 3 个 函数 受到 环境 变量 TZ 的 影响 。 这 3 个 函数 
是 localtime, mktime 和 strftime。 如 果 定 义 了 TZ， 则 这 些 函 数 将 使 用 其 值 代替 系统 默认 
时 区 。 如 果 Tz 定 义 为 空 串 ( 即 Tz=), 则 使 用 协调 统一 时 间 UTC。Tz 的 值 常常 类 似 于 TZ=EST5EDT， 
但 是 POSIX.1 允许 更 详细 的 说 明 。 有 关 Tz 变量 的 详细 情况 ， 请 参阅 Single UNIX Specification 
[Open Group 2010] 中 的 环境 变量 章节 。 
关于 Tz 环境 变量 的 更 多 信息 可 参见 手册 页 tzset(3). 





习题 157 


6.11 小 结 


所 有 UNIX 系统 都 使 用 口令 文件 和 组 文件 。 我 们 说 明了 读 这 些 文件 的 各 种 函数 。 本 章 也 介绍 
了 阴影 口令 ， 它 可 以 增加 系统 的 安全 性 。 附 属 组 ID 提供 了 一 个 用 户 同时 可 以 参加 多 个 组 的 方法 。 
我 们 还 介绍 了 大 多 数 系统 所 提供 的 访问 其 他 与 系统 有 关 数 据 文件 的 类 似 函 数 。 我 们 讨论 了 几 个 
POSIX.1 的 系统 标识 函数 ， 应 用 程序 使 用 它们 以 标识 它 在 何 种 系统 上 运行 。 最 后 ， 说 明了 ISO C 
和 Single UNIX Specification 提供 的 与 时 间 和 日 期 有 关 的 一 些 函数 。 


习题 


6.1 ”如 果 系 统 使 用 阴影 文件 ， 那 么 如 何 取 得 加 密 口 令 ? 

6.2 ”假设 你 有 超级 用 户 权限 ， 并 且 系 统 使 用 了 阴影 口令 ， 重 新 考虑 上 一 道 习 题 。 

6.3 ”编写 一 程序 ， 它 调用 uname 并 输出 utsname 结构 中 的 所 有 字段 ， 将 该 输出 与 uname(1) 命 
令 的 输出 结果 进行 比较 。 

64 ”计算 可 由 time_t 数据 类 型 表示 的 最 近 时 间 。 如 果 超 出 了 这 一 时 间 将 会 如 何 ? 

65 ”编写 一 程序 ， 获 取 当 前 时 间 ， 并 使 用 strftime 将 输出 结果 转换 为 类 似 于 date(1) 命 令 的 
默认 输出 。 将 环境 变量 Tz 设置 为 不 同 值 ， 观 察 输出 结果 。 





进程 环境 





7.1 引言 


下 一 章 将 介绍 进程 控制 原 语 ， 在 此 之 前 需 先 了 解 进程 的 环境 。 本 章 中 将 学 习 : 当 程 序 执行 时 ， 其 
main 函数 是 如 何 被 调用 的 ;命令 行 参数 是 如 何 传递 给 新 程序 的 ， 典 型 的 存储 空间 布局 是 什么 样式 ; 
如 何 分 配 男 外 的 存储 空间 ; 进程 如 何 使 用 环境 变量 :进程 的 各 种 不 同 终止 方式 等 。 另 外 ， 还 将 说 明 
longjmp 和 setjmp 函数 以 及 它们 与 栈 的 交互 作用 。 本 章 结束 之 前 ， 还 将 查看 进程 的 资源 限制 。 


7.2 main 国 数 


C 程序 总 是 从 main 函数 开始 执行 。main 函数 的 原型 是 : 
int main(int argc, char *argv[]); 


其 中 ，argc 是 命令 行 参数 的 数目 ，argv 是 指向 参数 的 各 个 指针 所 构成 的 数组 。7.4 节 将 对 命令 行 
参数 进行 说 明 。 

当 内 核 执行 C 程序 时 (使 用 一 个 exec ERA, 8.10 节 将 说 明 exec 函数 )， 在 调用 main 前 先 
调用 一 个 特殊 的 启动 例 程 。 可 执行 程序 文件 将 此 启动 例 程 指定 为 程序 的 起 始 地 址 一 一 这 是 由 连接 
编辑 器 设置 的 , 而 连接 编辑 器 则 由 C 编译 器 调用 ,启动 例 程 从 内 核 取得 命令 行 参 数 和 环境 变量 值 ， 

然后 为 按 上 述 方式 调用 main 函数 做 好 安排 。 


7.3 ”进程 终止 


有 8 种 方式 使 进程 终止 〈termination)， 其 中 5 种 为 正常 终止 ， 它 们 是 : 
(1) 从 main 返回 ; 

(2) 调用 exit; 

(3) 调用 exit gk Exit: 

(4) 最 后 一 个 线程 从 其 启动 例 程 返回 〈11.5 节 ); 

(5) 从 最 后 一 个 线程 调用 pthread_exit (11.5 节 )。 

异常 终止 有 3 种 方式 ， 它 们 是 : 

(6) 调用 abort (10.17 1$); 

C) 接 到 一 个 信号 (10.2 节 ); 

(8) 最 后 一 个 线程 对 取消 请 求 做 出 响应 (11.5 节 和 12.7 节 )。 
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在 第 11 章 和 第 12 章 讨论 线程 之 前 ， 我 们 暂 不 考虑 专门 针对 线程 的 3 种 终止 方式 。 


上 节 提 及 的 启动 例 程 是 这 样 编写 的 ， 使 得 从 main 返回 后 立即 调用 exit 函数 。 如 果 将 启动 例 
FELL C 代码 形式 表示 实际 上 该 例 程 常常 用 汇编 语言 编写 )， 则 它 调用 main 函数 的 形式 可 能 是 : 
exit (main (argc, argv)); 
1. 退出 函数 
3 个 函数 用 于 正常 终止 一 个 程序 ，_exit 和 _Exit 立即 进入 内 核 ，exit 则 先 执行 一 些 清理 
处 理 ， 然 后 返回 内 核 。 
#include <stdlib.h> 
void exit (int status); 
void _Exit(int Status) ; 


#include <unistd.h> 





void _exit(int status) ; 
我 们 将 在 8.5 节 中 讨论 这 3 个 函数 对 其 他 进程 (如 正在 终止 进程 的 父 进程 和 子 进程 ) 的 影响 。 
使 用 不 同 头 文件 的 原因 是 exit 和 Exit 是 由 ISO C 说 明 的 ,而 exit 是 由 POSIX.1 说 明 的 。 


由 于 历史 原因 ，exit 函数 总 是 执行 一 个 标准 IO 库 的 清理 关闭 操作 : 对 于 所 有 打开 流 调用 
fclose 函数 。 回 忆 5.5 节 ， 这 造成 输出 缓冲 中 的 所 有 数据 都 被 冲洗 〈 写 到 文件 上 )。 

3 个 退出 函数 都 带 一 个 整 型 参数 ， 称 为 终止 状态 (或 退出 状态 ，exit status)。 大 多 数 UNIX 系 
统 shell 都 提供 检查 进程 终止 状态 的 方法 。 如 果 (a) 调用 这 些 函 数 时 不 带 终 止 状态 , 或 (b) main 
执行 了 一 个 无 返回 值 的 return 语句 , 或 (c) main 没有 声明 返回 类 型 为 整 型 ， 则 该 进程 的 终止 
状态 是 未 定义 的 。 但 是 , 若 main 的 返回 类 型 是 整 型 , 并 日 main 执行 到 最 后 一 条 语句 时 返回 CES 
式 返 回 )， 那 么 该 进程 的 终止 状态 是 0。 

这 种 处 理 是 ISO C 标准 1999 版 引入 的 。 历 史上 ， 若 main 函数 终止 时 没有 显 式 使 用 return 
语句 或 调用 exit 函数 ， 那 么 进程 终止 状态 是 未 定义 的 。 

main 函数 返回 一 个 整 型 值 与 用 该 值 调 用 exit 是 等 价 的 。 于 是 在 main 函数 中 

exit (0); 
等 价 于 


return (0); 


下 实例 
图 7-1 中 的 程序 是 经 典 的 “hello, world” 实 例 。 


#include <stdio.h> 
main () 
{ 
printf("hello, world\n"); 
} 


图 7-1 经 典 C 程序 
对 该 程序 进行 编译 ， 然 后 运行 ， 则 可 见 到 其 终止 码 是 随机 的 。 如 果 在 不 同 的 系统 上 编译 该 程 
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序 ， 我 们 很 可 能 得 到 不 同 的 终止 码 ， 这 取决 于 main 函数 返回 时 栈 和 寄存 器 的 内 容 : 


$ gcc hello.c 


$ ./a.out 
hello, world 
$ echo $? 打印 终止 状态 
13 
现在 ， 我 们 启用 1999 ISO C 编译 器 扩展 ， 则 可 见 到 终止 码 改变 了 : 
$ gcc -std=c99 hello.c 启用 acc 的 1999 ISO C 扩展 
hello.c:4: warning: return type defaults to 'int' 
$ ./a.out 
hello, world 
$ echo $? 打印 终止 状态 
0 


注意 , 当 我 们 启用 1999 ISO C 扩展 时 ,编译 器 发 出 警告 消息 。 打印 该 警告 消息 的 原因 是 : main 
函数 的 类 型 没有 显 式 地 声明 为 整 型 。 如 果 我 们 增加 了 这 一 声明 ， 那 么 此 警告 消息 就 不 会 出 现 。 但 
是 ,如 果 我 们 使 编译 器 所 推荐 的 警告 消息 都 起 作用 ( 使 用 -Wall 标志 ), 则 可 能 见 到 类 似 于 “control 
reaches end of nonvoid function.” ( 控制 到 达 非 void 函数 的 尾 端 ) 这 样 的 警告 消息 。 

将 main 声明 为 返回 整 型 ， 但 在 main 函数 体内 用 exit 代替 return， 对 某 些 C 编译 器 和 
UNIX 1int(]) 程 序 而 言 会 产生 不 必要 的 警告 信息 ， 因 为 这 些 编译 器 并 不 了 解 main 中 的 exit 与 
return 语句 的 作用 相同 。 避 开 这 种 警告 信息 的 一 种 方法 是 在 main 中 使 用 return 语句 而 不 是 
exit。 但 是 这 样 做 的 结果 是 不 能 用 UNIX 的 grep 实用 程序 来 找 出 程序 中 所 有 的 exit 调用 。 另 
一 个 解决 方法 是 将 main 说 明 为 返回 void 而 不 是 int, 然后 仍然 调用 exit. 这 样 做 可 以 避免 编 
译 器 的 警告 ， 但 从 程序 设计 角度 看 却 并 不 正确 ， 而 且 会 产生 其 他 的 编译 警告 ， 因 为 main 的 返回 
类 型 应 当 是 带 符号 整 型 。 本 章 将 main 表示 为 返回 整 型 ， 因 为 这 是 ISO C 和 POSIX.1 所 定义 的 。 

不 同 的 编译 器 产生 警告 消息 的 详细 程度 是 不 一 样 的 。 除 非 使 用 警告 选项 , 否则 GNU C 编译 器 


不 会 发 出 不 必要 的 警告 消息 。 E] 
下 一 章 我 们 将 了 解 进程 如 何 造 成 程序 被 执行 ， 如 何等 竺 进程 完成 ， 然 后 又 如 何 获取 其 终止 状态 。 
2. BR atexit 


按照 ISO C 的 规定 ， 一 个 进程 可 以 登记 多 至 32 个 函数 ,这 些 函 数 将 由 exit 自动 调用 。 我 们 
称 这 些 函 数 为 终止 处 理 程序 (exit handler)， 并 调用 atexit 函数 来 登记 这 些 函 数 。 


#include <stdlib.h> 





int atexit (void (*func) (void) ) 


BE: FRH, BIO; rite, BEE o 





其 中 ，atexit 的 参数 是 一 个 函数 地 址 ， 当 调用 此 函数 时 无 需 向 它 传 递 任 何 参数 ， 也 不 期 望 
它 返回 一 个 值 。exit 调用 这 些 函 数 的 顺序 与 它们 登记 时 候 的 顺序 相反 。 同 一 函数 如 若 登 记 多 次 ， 
也 会 被 调用 多 次 。 
终止 处 理 程序 这 一 机 制 是 由 ANSI C 标准 于 1989 年 引入 的 。 早 于 ANSI C 的 系统 ， 如 SVR3 
和 4.3BSD， 都 不 提供 这 种 终止 处 理 程序 。 
ISO C 要 求 ， 系 统 至 少 应 支持 32 个 终止 处 理 程序 ,但 实现 经 常会 提供 更 多 的 支持 (参见 图 2-15 )。 
为 了 确定 一 个 给 定 的 平台 支持 的 最 大 终止 处 理 程序 数 ， 可 以 使 用 sysconf 函数 (如 图 2-14 所 示 )。 
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根据 ISO C 和 POSIX.1，exit 首先 调用 各 终止 处 理 程序 ， 然 后 关闭 (通过 fclose) 所 有 打 
开 流 。POSIX.1 扩展 了 ISO C 标准 ， 它 说 明 ， 如 若 程 序 调 用 exec 函数 族 中 的 任 一 函数 ， 则 将 清 
除 所 有 已 安装 的 终止 处 理 程 序 。 图 7-2 显示 了 一 个 C 程序 是 如 何 启动 的 , 以 及 它 终 止 的 各 种 方式 。 
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图 7-2 ”一 个 C 程序 是 如 何 启动 和 终止 的 
注意 ， 内 核 使 程序 执行 的 唯一 方法 是 调用 一 个 exec 函数 。 进 程 自愿 终止 的 唯一 方法 是 显 式 或 
隐 式 地 (通过 调用 exit) 调用 _exit 或 _ Exit。 进程 也 可 非 自愿 地 由 一 个 信号 使 其 终止 (图 7-2 
中 没有 显示 )。 201 


y KB 
7-3 的 程序 说 明 如 何 使 用 atexit 函数 。 


#include "apue.h" 





static void my_exitl (void); 
static void my_exit2 (void); 


int 
main (void) 
{ 
if (atexit(my exit2) != 0) 
err sys("can't register my exit2"); 


if (atexit(my exitl) != 0) 
err sys("can't register my exitl"); 
if (atexit(my exitl) != 0) 


err sys("can't register my exitl"); 
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printf ("main is done\n"); 
return(0); 


} 


static void 
my_exitl (void) 
{ 
printf("first exit handler\n"); 


} 


static void 
my_exit2 (void) 
{ 
printf ("second exit handler\n"); 
) 


图 7-3 终止 处 理 程序 实例 
执行 该 程序 产生 : 


$ ./a.out 

main is done 

first exit handler 
first exit handler 
second exit handler 


终止 处 理 程序 每 登记 一 次 ， 就 会 被 调用 一 次 。 在 图 7-3 的 程序 中 ， 第 一 个 终止 处 理 程序 被 登 
记 两 次 ， 所 以 也 会 被 调用 两 次 。 注 意 ， 在 main 中 没有 调用 exit, MEAT return WAJ. m 


7.4 ”命令 行 参 数 


当 执 行 一 个 程序 时 ， 调 用 exec 的 进程 可 将 命令 行 参数 传递 给 该 新 程序 。 这 是 UNIX shell 的 
一 部 分 常规 操作 。 在 前 儿童 的 很 多 实例 中 ， 我 们 已 经 看 到 了 这 一 点 。 


a XA 


图 7-4 所 示 的 程序 将 其 所 有 命令 行 参数 都 回 显 到 标准 输出 上 。 注 意 ， 通 常 的 echo(1) 程 序 不 
回 显 第 0 个 参数 。 


#include "apue.h" 


int 
main(int argc, char *argv[]) 
{ 


int Lg 


for (i = 0; i < argc; i++) /* echo all command-line args */ 
printf ("argv[%d]: s\n", i, argv[i]); 
exit (0); 





图 7-4 ”将 所 有 命令 行 参数 回 显 到 标准 输出 
编译 此 程序 ， 并 将 可 执行 代码 文件 命名 为 echoarg， 则 得 到 : 
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$ ./echoarg argl TEST foo 
argv[0]: ./echoarg 
argv[1]: argl 

argv[2]: TEST 

argv[3]: foo 


ISO C 和 POSIX.1 都 要 求 argv [arge] 是 一 个 空 指针 。 这 就 使 我 们 可 以 将 参数 处 理 循环 改写 为 : 


for (i = 0; argv[i] != NULL; i++) m 


7.5 WAR 


每 个 程序 都 接收 到 一 张 环 境 表 。 与 参数 表 一 样 ， 环 境 表 也 是 一 个 字符 指针 数组 ， 其 中 每 个 指 
针 包 含 一 个 以 null 结束 的 C 字符 串 的 地 址 。 全 局 变量 environ 则 包含 了 该 指针 数组 的 地 址 : 


extern char **environ; 


例如 ， 如 果 该 环境 包含 5 个 字符 串 ， 那 么 它 看 起 来 如 图 7-5 中 所 示 。 其 中 ， 每 个 字符 串 的 结尾 处 
都 显 式 地 有 一 个 null 字 节 。 我 们 称 environ 为 环境 指针 (environment pointer)， 指 针 数 组 为 环境 
表 ， 其 中 各 指针 指向 的 字符 串 为 环境 字符 囊 。 

环境 指针 环境 表 环境 字符 串 


environ: —— — —»- HOME=/home/sar\0 
—L— — PATH=: /bin:/usr/binNO 
—L— —»- SHELL=/bin/bash\0 
一 | ——»- USER=sar\0 


LOGNAME=sar\0 








NULL 


图 7-5 由 5 个 字符 串 组 成 的 环境 

按照 惯例 ， 环 境 由 

name = value 
这 样 的 字符 串 组 成 ， 如 图 7-5 中 所 示 。 大 多 数 预定 义 名 完全 由 大 写字 母 组 成 ， 但 这 只 是 一 个 惯例 。 

在 历史 上 , 大 多 数 UNIX 系统 支持 main 函数 带 3 个 参数 , 其 中 第 3 个 参数 就 是 环境 表 地 址 : 

int main(int argc, char *argv[], char *envp[]); 
ALA ISO C 规定 main 函数 只 有 两 个 参数 ， 而 且 第 3 个 参数 与 全 局 变量 environ 相 比 也 没有 带 
来 更 多 益处 ， 所 以 POSIX.1 也 规定 应 使 用 environ 而 不 使 用 第 3 个 参数 。 通 常用 getenv 和 
putenv 函数 ( 见 7.9 节 ) 来 访问 特定 的 环境 变量 ， 而 不 是 用 environ 变量 。 但 是 ， 如 果 要 查看 
整个 环境 ， 则 必须 使 用 environ 指针 。 


7.6 C 程序 的 存储 空间 布局 


历史 沿袭 至 今 ，C 程序 一 直 由 下 列 儿 部 分 组 成 : 
。 正文 段 。 这 是 由 CPU 执行 的 机 器 指令 部 分 。 通 常 ， 正 文 段 是 可 共享 的 ， 所 以 即使 是 频繁 
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执行 的 程序 (如 文本 编辑 器 、C 编译 器 和 shell 等 ) 在 存储 器 中 也 只 需 有 一 个 副本 ， 另 外 ， 


[204] 正文 段 常常 是 只 读 的 ， 以 防止 程序 由 于 意外 而 修改 其 指令 。 
。 初始 化 数据 段 。 通 常 将 此 段 称 为 数据 段 ， 它 包含 了 程序 中 需 明确 地 赋 初 值 的 变量 。 例 如 ， 
C 程序 中 任何 函数 之 外 的 声明 : 
int maxcount = 99; 


使 此 变量 以 其 初 值 存 放 在 初始 化 数据 段 中 。 

。 未 初始 化 数据 段 。 通 常 将 此 段 称 为 bss 段 ， 这 一 名 称 来 源 于 早期 汇编 程序 一 个 操作 符 ， 意 
思 是 “由 符号 开始 的 块 ”(block started by symbol)， 在 程序 开始 执行 之 前 ， 内 核 将 此 段 中 
的 数据 初始 化 为 0 或 空 指针 。 函 数 外 的 声明 : 


long  sum[1000]; 








使 此 变量 存放 在 非 初 始 化 数据 段 中 。 
。 栈 。 自 动 变量 以 及 每 次 函数 调用 时 所 需 保存 的 信 。 高 好 址 \ een 

息 都 存放 在 此 段 中 。 每 次 函数 调用 时 ， 其 返回 地 ENF "mers 

址 以 及 调用 者 的 环境 信息 (如 某 些 机 器 寄存 器 的 [^] none 

值 ) 都 存放 在 栈 中 。 然 后 ， 最 近 被 调用 的 函数 在 

栈 上 为 其 自动 和 临时 变量 分 配 存储 空间 。 通 过 以 

这 种 方式 使 用 栈 ，C 递归 函数 可 以 工作 。 递 归 函 

数 每 次 调用 自身 时 ， 就 用 一 个 新 的 栈 帧 ， 因 此 一 eee eae | 

次 函数 调用 实例 中 的 变量 集 不 会 影响 另 一 次 函 堆 

数 调用 实例 中 的 变量 。 未 初始 化 的 数据 } hh exec Milk 
。 堆 。 通 常 在 堆 中 进行 动态 存储 分 配 。 由 于 历史 上 形 (bss) 为 0 

成 的 惯例 ， 堆 位 于 未 初始 化 数据 段 和 栈 之 间 。 初始 化 的 数据 
图 7-6 显示 了 这 些 段 的 一 种 典型 安排 方式 。 这 是 程 tl EX AER. 

序 的 逻辑 布局 ， 虽 然 并 不 要 求 一 个 具体 实现 一 定 以 这 种 


方式 安排 其 存储 空间 ， 但 这 是 一 种 我 们 便于 说 明 的 典型 图 7-6 典型 的 存储 空间 安排 
安排 。 对 于 32 位 Intel x86 处 理 器 上 的 Linux， 正 文 段 从 0x08048000 单元 开始 ， 栈 底 则 在 
0xC0000000 之 下 开始 (在 这 种 特定 结构 中 ， 栈 从 高 地 址 向 低地 址 方向 增长 )。 堆 顶 和 栈 顶 之 间 
未 用 的 虚 地 址 空间 很 大 。 


a.out 中 还 有 若干 其 他 类 型 的 段 ， 如 包含 符号 表 的 段 、 包 含 调试 信息 的 段 以 及 包含 动态 共享 
库 链 接 表 的 段 等 。 这 些 部 分 并 不 装载 到 进程 执行 的 程序 映像 中 。 


从 图 7-6 还 可 注意 到 ， 未 初始 化 数据 段 的 内 容 并 不 存放 在 磁盘 程序 文件 中 。 其 原因 是 ， 内 核 
在 程序 开始 运行 前 将 它们 都 设置 为 0。 需 要 存放 在 磁盘 程序 文件 中 的 段 只 有 正文 段 和 初始 化 数 
据 段 。 
size(1) 命 令 报 告 正文 段 、 数 据 段 和 bss 段 的 长 度 〔( 以 字 节 为 单位 )。 例 如 : 
$ size /usr/bin/cc /bin/sh 
text data bss dec hex filename 


346919 3576 6680 357175 57337  /usr/bin/cc 
102134 1776 11272 115182  1clee  /bin/sh 


第 4 列 和 第 5 列 是 分 别 以 十 进 制 和 十 六 进 制 表示 的 3 段 总 长 度 。 
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7.7 3E 


现在 ， 大 多 数 UNIX 系统 支持 共享 库 。Arnold[1986] 说 明了 System V 上 共享 库 的 一 个 早期 实 
HR, Gingell 等 [1987] 则 说 明了 SunOS 上 的 另 一 个 实现 。 共 享 库 使 得 可 执行 文件 中 不 再 需要 包含 公 
用 的 库 函 数 ， 而 只 需 在 所 有 进程 都 可 引用 的 存储 区 中 保存 这 种 库 例 程 的 一 个 副本 。 程 序 第 一 次 执 
行 或 者 第 一 次 调用 某 个 库 函 数 时 ， 用 动态 链接 方法 将 程序 与 共享 库 函 数 相 链接 。 这 减少 了 每 个 可 
执行 文件 的 长 度 ， 但 增加 了 一 些 运行 时 间 开销 。 这 种 时 间 开 销 发 生 在 该 程序 第 一 次 被 执行 时 ， 或 
者 每 个 共享 库 函 数 第 一 次 被 调用 时 。 共 享 库 的 另 一 个 优点 是 可 以 用 库 函 数 的 新 版 本 代替 老 版 本 而 
无 需 对 使 用 该 库 的 程序 重新 连接 编辑 〈 假 定 参数 的 数目 和 类 型 都 没有 发 生 改变 )。 

在 不 同 的 系统 中 ， 程 序 可 能 使 用 不 同 的 方法 说 明 是 否 要 使 用 共享 库 。 比 较 典 型 的 有 cc(1) 和 [206] 
1d(1) 命 令 的 选项 。 作 为 长 度 方面 发 生变 化 的 例子 ， 先 用 无 共享 库 方 式 创建 下 列 可 执行 文件 (典型 
的 hello.c 程序 ): 


$ gcc -static hellol.c 阻止 gcc 使 用 共享 库 
$ ls -1 a.out 
-rwxrwxr-x 1 sar 879443 Sep 2 10:39 a.out 
$ size a.out 
text data bss dec hex filename 
787715 6128 11272 805175  c4937 a.out 
如 果 再 使 用 共享 库 编译 此 程序 ， 则 可 执行 文件 的 正文 和 数据 段 的 长 度 都 显著 减 小 : 
$ gcc hellol.c gcc 默认 使 用 共享 库 
$ 1s -1 a.out 
-rwxrwxr-x 1 sar 8378 Sep 2 10:39 a.out 
$ size a.out 
text data bss dec hex filename 
1176 504 16 1696 6a0 a.out 


7.8 存储 空间 分 配 


ISO C 说 明了 3 个 用 于 存储 空间 动态 分 配 的 函数 。 

(1) malloc， 分 配 指定 字 节 数 的 存储 区 。 此 存储 区 中 的 初始 值 不 确定 。 

(2) calloc， 为 指定 数量 指定 长 度 的 对 象 分 配 存储 空间 。 该 空间 中 的 每 一 位 Coit) 都 初始 
化 为 0。 

(3) realloc， 增 加 或 减少 以 前 分 配 区 的 长 度 。 当 增加 长 度 时 ， 可 能 需 将 以 前 分 配 区 的 内 容 
移 到 另 一 个 足够 大 的 区 域 ， 以 便 在 尾 端 提 供 增加 的 存储 区 ， 而 新 增 区 域内 的 初始 值 则 不 确定 。 


#include <stdlib.h> 


void *malloc(size_t size); 


void *calloc(size t nobj, size t size); 


void *realloc(void *ptr, size t newsize); 


3 个 函数 返回 值 : 若 成 功 ， 返 回 非 空 指针 ， 若 出 错 ， 返 回 NULL 





void free(void *ptr); 


这 3 个 分 配 函 数 所 返回 的 指针 一 定 是 适当 对 齐 的 ， 使 其 可 用 于 任何 数据 对 象 。 例 如 ， 在 一 个 
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特定 的 系统 上 ， 如 果 最 苛刻 的 对 齐 要 求 是 ，double 必须 在 8 的 倍数 地 址 单元 处 开始 ， 那 么 这 3 
个 函数 返回 的 指针 都 应 这 样 对 齐 。 
因为 这 3 个 alloc 函数 都 返回 通用 指针 void *， 所 以 如 果 在 程序 中 包括 了 #include 
<stdlib.h>《〔〈 以 获得 函数 原型 )， 那 么 当 我 们 将 这 些 函数 返回 的 指针 赋予 一 个 不 同类 型 的 指针 时 ， 就 
不 需要 显 式 地 执行 强制 类 型 转换 。 未 声明 函数 的 默认 返回 值 为 int,， 所 以 使 用 没有 正确 函数 声明 的 强制 
类 型 转换 可 能 会 隐藏 系统 错误 ， 因 为 int 类 型 的 长 度 与 函数 返回 类 型 值 的 长 度 不 同 〈 本 例 中 是 指针 )。 
函数 free 释放 ptr 指向 的 存储 空间 。 被 释放 的 空间 通常 被 送 入 可 用 存储 区 池 ， 以 后 ， 可 在 
调用 上 述 3 个 分 配 函 数 时 再 分 配 。 
realloc 函数 使 我 们 可 以 增 、 减 以 前 分 配 的 存储 区 的 长 度 ( 最 常见 的 用 法 是 增加 该 区 )。 例 
如 ， 如 果 先 为 一 个 数组 分 配 存 储 空 间 ， 该 数组 长 度 为 512， 然 后 在 运行 时 填充 它 ， 但 运行 一 段 时 
间 后 发 现 该 数组 原先 的 长 度 不 够 用 ， 此 时 就 可 调用 realloc 扩充 相应 存储 空间 。 如 果 在 该 存储 
区 后 有 足够 的 空间 可 供 扩 充 ， 则 可 在 原 存 储 区 位 置 上 向 高 地 址 方向 扩充 ， 无 需 移动 任何 原先 的 内 
容 ， 并 返回 与 传 给 它 相 同 的 指针 值 。 如 果 在 原 存储 区 后 没有 足够 的 空间 ， 则 realloc 分 配 男 一 
个 足够 大 的 存储 区 ， 将 现存 的 512 个 元 素数 组 的 内 容 复制 到 新 分 配 的 存储 区 。 然 后 ， 释 放 原 存储 
区 ， 返 回 新 分 配 区 的 指针 。 因 为 这 种 存储 区 可 能 会 移动 位 置 , 所 以 不 应 当 使 任何 指针 指 在 该 区 中 。 
习题 4.16 和 图 C-3 显示 了 在 getowd 中 如 何 使 用 realloc, 以 处 理 任 何 长 度 的 路 径 名 。 图 17-27 
的 程序 是 使 用 realloc 的 另 一 个 例子 ， 用 其 可 以 避免 使 用 编译 时 固定 长 度 的 数组 。 
注意 ，realloc 的 最 后 一 个 参数 是 存储 区 的 新 长 度 , 不 是 新 、 旧 存储 区 长 度 之 差 。 作 为 一 个 特例 ， 
若 ptr 是 一 个 空 指针 , 则 realloc 的 功能 与 malloc 相同 , 用 于 分 配 一 个 指定 长 度 为 newsize 的 存储 区 。 


这 些 函 数 的 早期 版 本 允许 调用 realloc 分 配 自 上 次 malloc、realloc 或 calloc 调用 以 
来 所 释放 的 块 。 这 种 技巧 可 回溯 到 V7， 它 利用 malloc 的 搜索 策略 ， 实 现存 储 器 紧缩 。Solaris 
仍 支持 这 一 功能 ， 而 很 多 其 他 平台 则 不 支持 。 这 种 功能 不 被 赞同 ， 不 应 再 使 用 。 


这 些 分 配 例 程 通常 用 sbrk(2) 系 统 调用 实现 ,该 系统 调用 扩充 (或 缩小 ) 进 程 的 堆 ( 见 图 7-6). 
malloc All free 的 一 个 样 例 实现 请 见 Kernighan 和 Ritchie[1988] 的 8.7 节 。 

虽然 sbrk 可 以 扩充 或 缩小 进程 的 存储 空间 ， 但 是 大 多 数 malloc 和 free 的 实现 都 不 减 小 
进程 的 存储 空间 。 有 释放 的 空间 可 供 以 后 再 分 配 ， 但 将 它们 保持 在 malloc 池 中 而 不 返回 给 内 核 。 

大 多 数 实现 所 分 配 的 存储 空间 比 所 要 求 的 要 稍 大 一 些 ， 额 外 的 空间 用 来 记录 管理 信息 一 一 分 
配 块 的 长 度 、 指 向 下 一 个 分 配 块 的 指针 等 。 这 就 意味 着 ， 如 果 超 过 一 个 已 分 配 区 的 尾 端 或 者 在 已 
分 配 区 起 始 位 置 之 前 进行 写 操 作 , 则 会 改写 另 一 块 的 管理 记录 信息 。 这 种 类 型 的 错误 是 灾难 性 的 ， 
但 是 因为 这 种 错误 不 会 很 快 就 暴露 出 来 ， 所 以 也 就 很 难 发 现 。 

在 动态 分 配 的 缓冲 区 前 或 后 进行 写 操作 ， 破 坏 的 可 能 不 仅仅 是 该 区 的 管理 记录 信息 。 在 动态 

208] 分 配 的 缓冲 区 前 后 的 存储 空间 很 可 能 用 于 其 他 动态 分 配 的 对 象 。 这 些 对 象 与 破坏 它们 的 代码 可 能 

无 关 ， 这 造成 寻求 信息 破坏 的 源头 更 加 困难 。 

其 他 可 能 产生 的 致命 性 的 错误 是 : 释放 一 个 已 经 释放 了 的 块 ， 调 用 free 时 所 用 的 指针 不 是 
3 个 alloc 函数 的 返回 值 等 。 如 若 一 个 进程 调用 malloc MRM, (HH ICA free MA, MA 
该 进程 占用 的 存储 空间 就 会 连续 增加 ， 这 被 称 为 洪 漏 〈leakage)。 如 果 不 调用 free 函数 释放 不 再 
使 用 的 空间 ， 那 么 进程 地 址 空间 长 度 就 会 慢 慢 增加 ， 直 至 不 再 有 空闲 空间 。 此 时 ， 由 于 过 度 的 换 
页 开销 ， 会 造成 性 能 下 降 。 

因为 存储 空间 分 配 出 错 很 难 跟踪 ， 所 以 某 些 系统 提供 了 这 些 函 数 的 另 一 种 实现 版 本 。 每 次 调 
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用 这 3 个 分 配 函 数 中 的 任意 一 个 或 free 时 ， 它 们 都 进行 附加 的 检 错 。 在 调用 连接 编辑 器 时 指定 
-个 专用 库 ， 在 程序 中 就 可 使 用 这 种 版 本 的 函数 。 此 外 还 有 公共 可 用 的 资源 ， 在 对 其 进行 编译 时 
使 用 一 个 特殊 标志 就 会 使 附加 的 运行 时 检查 生效 。 
FreeBSD, Mac OS X 以 及 Linux 通过 设置 环境 变量 支持 附加 的 调试 功能 。 另 外 ， 通 过 符号 链 
接 /etc/malloc.conf 可 将 选项 传递 给 FreeBSD 函数 库 。 


替代 的 存储 空间 分 配 程序 


有 很 多 可 替代 malloc 和 free 的 函数 。 某 些 系 统 已 经 提供 替代 存储 空间 分 配 函 数 的 库 。 另 
一 些 系统 只 提供 标准 的 存储 空间 分 配 程序 。 如 果 需 要 ， 软 件 开 发 者 可 以 下 载 替 代 函 数 。 下 面 讨论 
某 些 替代 函数 和 库 。 

1. libmalloc 

基于 SVR4 的 UNIX 系统 ， 如 Solaries, HAAS libmalloc 库 ， 它 提供 了 一 套 与 ISO C 存储 
空间 分 配 函 数 相 匹配 的 接口 。1ibmalloc 库 包括 mallopt 函数 ， 它 使 进程 可 以 设置 一 些 变量 ， 
并 用 它们 来 控制 存储 空间 分 配 程序 的 操作 。 还 可 使 用 另 一 个 名 为 mallinfo 的 函数 ， 以 对 存储 空 
间 分 配 程序 的 操作 进行 统计 。 

2. vmalloc 

Vo[1996] 说 明 一 种 存储 空间 分 配 程序 ， 它 允许 进程 对 于 不 同 的 存储 区 使 用 不 同 的 技术 。 除 了 
一 些 ymalloc 特有 的 函数 外 ， 该 库 也 提供 了 ISO C 存储 空间 分 配 函 数 的 仿真 器 。 

3. quick-fit 

历史 上 所 使 用 的 标准 malloc 算法 是 最 佳 适 配 或 首次 适 配 存 储 分 配 策略 。quick-fit ( 快 
速 适 配 ) 算法 比 上 述 两 种 算法 快 , 但 可 能 使 用 较 多 存储 空间 。Weinstock 和 Wulf[1988] 对 该 算法 进 
行 了 描述 ， 该 算法 基于 将 存储 空间 分 裂 成 各 种 长 度 的 缓冲 区 ， 并 将 未 使 用 的 缓冲 区 按 其 长 度 组 成 
不 同 的 空闲 区 列表 。 现 在 许多 分 配 程序 都 基于 快速 适 配 。 

4. jemalloc 

jemalloc 函数 实现 是 FreeBSD 8.0 中 的 默认 存储 空间 分 配 程序 ， 它 是 库 函 数 malloc 族 在 
FreeBSD 中 的 实现 。 它 的 设计 具有 良好 的 可 扩展 性 ， 可 用 于 多 处 理 器 系统 中 使 用 多 线程 的 应 用 程 
序 。Evans[2006] 说 明了 具体 实现 及 其 性 能 评估 。 

5. TCMalloc 

TCMalloc 函数 用 于 替代 malloc 函数 族 以 提供 高 性 能 、 高 扩展 性 和 高 存储 效率 。 从 高 速 组 
存 中 分 配 缓冲 区 以 及 释放 缓冲 区 到 高 速 缓存 中 时 ， 它 使 用 线程 -本 地 高 速 缓存 来 避免 锁 开 销 。 它 还 
有 内 置 的 堆 检查 程序 和 堆 分 析 程 序 帮助 调试 和 分 析 动 态 存储 的 使 用 .TCMalloc 库 是 开源 可 用 的 ， 
是 Google-perftools 工具 中 的 一 个 。Ghemawat 和 Menage[2005] 对 此 做 了 简单 介绍 。 

6. BR alloca 

还 有 一 个 函数 也 值得 一 提 ， 这 就 是 alloca。 它 的 调用 序列 与 malloc 相同 ， 但 是 它 是 在 当 
前 函数 的 栈 帧 上 分 配 存储 空间 ， 而 不 是 在 堆 中 。 其 优点 是 : 当 函 数 返回 时 ， 自 动 释放 它 所 使 用 的 
栈 帧 ， 所 以 不 必 再 为 释放 空间 而 费心 。 其 缺点 是 : alloca 函数 增加 了 栈 帧 的 长 度 ， 而 某 些 系统 
在 函数 已 被 调用 后 不 能 增加 栈 帧 长 度 ， 于 是 也 就 不 能 支持 alloca 函数 。 尽 管 如 此 ， 很 多 软件 包 
还 是 使 用 alloca 函数 ， 也 有 很 多 系统 实现 了 该 函数 。 


本 书 中 讨论 的 4 个 平台 都 提供 了 alloca 函数 。 
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7.9 环境 变量 
如 同 前 述 ， 环 境 字符 串 的 形式 是 : 


name=value 
UNIX 内 核 并 不 查看 这 些 字符 串 ， 它 们 的 解释 完全 取决 于 各 个 应 用 程序 。 例 如 ，shell 使 用 了 大 量 
的 环境 变量 。 其 中 某 一 些 在 登录 时 自动 设置 (如 HOME. USER 等 )， 有 些 则 由 用 户 设 置 。 我 们 通 
常 在 一 个 shell 启动 文件 中 设置 环境 变量 以 控制 shell 的 动作 。 例 如 , 若 设置 了 环境 变量 MaAILPRTH， 
则 它 告诉 Bourne shell, GNU Bourne-again shell 和 Korn shell 到 哪里 去 查看 邮件 。 

ISO C 定义 了 一 个 函数 getenv， 可 以 用 其 取 环境 变量 值 ， 但 是 该 标准 又 称 环境 的 内 容 是 由 
实现 定义 的 。 


#include <stdlib.h> 


char *getenv(const char *name) ; 





返回 值 ， 指 向 与 name 关联 的 value 的 指针 ; 若 未 找到 ， 返 回 NULL 


注意 ， 此 函数 返回 一 个 指针 ， 它 指向 name=value 字符 串 中 的 value。 我 们 应 当 使 用 getenv 
从 环境 中 取 一 个 指定 环境 变量 的 值 ， 而 不 是 直接 访问 environ。 

Single UNIX Specification 中 的 POSIX.1 定义 了 茶 些 环境 变量 。 如 果 支 持 XSI 扩展 ， 那 么 其 中 也 
包含 了 另外 一 些 环境 变量 定义 。 图 7-7 列 出 了 由 Single UNIX Specification 定义 的 环境 变量 ,并 指明 本 
书 讨论 的 4 种 实现 对 它们 的 支持 情况 。 由 POSIX.1 定义 的 各 环境 变量 标记 为 *， 耕 则 为 XSI 扩展。 本 
书 讨论 的 4 种 UNIX 实现 使 用 了 很 多 依赖 于 实现 的 环境 变量 。 注 意 ，ISO C 没有 定义 任何 环境 变量 。 


ied Linux MacOS M 


| conuMNs | 
DATEMSK 
HOME 

LANG 

LC ALL 

LC COLLATE 
LC CTYPE 
LC MESSAGES 
LC MONETARY 
LC NUMERIC 
LC TIME 
LINES 
LOGNAME 
MSGVERB 
NLSPATH 
PATH 

PWD 

SHELL 
TERM 
TMPDIR 

TZ 








| 终端 宽度 | 
getdate(3) 模 板 文件 路 径 名 
home 起 始 目录 

本 地 名 

本 地 名 

本 地 排序 名 

本 地 字符 分 类 名 

本 地 消息 名 

本 地 货币 编辑 名 

本 地 数字 编辑 名 

本 地 日 期 /时 间 格 式 名 

终端 高 度 

登录 名 

fmtmsg(3) 处 理 的 消息 组 成 部 分 
消息 类 模板 序列 

搜索 可 执行 文件 的 路 径 前 缀 列表 
当前 工作 目录 的 绝对 路 径 名 
用 户 首选 的 shell 名 

终端 类 型 

在 其 中 创建 临时 文件 的 目录 路 径 名 
时 区 信息 





图 7-7 Single UNIX Specification 定义 的 环境 变量 
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除了 获取 环境 变量 值 ， 有 时 也 需要 设置 环境 变量 。 我 们 可 能 希望 改变 现 有 变量 的 值 ， 或 者 是 
增加 新 的 环境 变量 。( 在 下 一 章 将 会 了 解 到 ， 我 们 能 影响 的 只 是 当前 进程 及 其 后 生成 和 调用 的 任 
何 子 进程 的 环境 ， 但 不 能 影响 父 进程 的 环境 ， 这 通常 是 一 个 shell 进程 。 尽 管 如 此 ， 修 改 环境 表 的 
能 力 仍然 是 很 有 用 的 。) 遗憾 的 是 ， 并 不 是 所 有 系统 都 支持 这 种 能 力 。 图 7-8 列 出 了 由 不 同 的 标准 
及 实现 支持 的 各 种 函数 。 21 


ISOC . POSIX.I FreeBSD 8.0 Linux 3.2.0 MacOSX 10.6.8 Solaris 10 


getenv 
putenv XSI 
setenv . 






unsetenv 
clearenv 


图 7-8. ”对 于 各 种 环境 表 函 数 的 支持 
clearenv 不 是 Single UNIX Specification 的 组 成 部 分 。 它 被 用 来 删除 环境 表 中 的 所 有 项 。 
在 图 7-8 中 ， 中 间 3 个 函数 的 原型 是 : 
#include <stdlib.h> 
int putenv(char *str); 


函数 返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 非 0 
int setenv(const char *name, const char *value, int rewrite) ; 


int unsetenv(const char *name) ; 








两 个 函数 返回 值 : 若 成 功 ， 返 回 0; 若 出错 ， 返 回 -1 

这 3 个 函数 的 操作 如 下 。 

。 putenv BRA name=value 的 字符 串 ， 将 其 放 到 环境 表 中 。 如 果 name 已 经 存在 ， 则 先 
删除 其 原来 的 定义 。 

e setenv 将 name 设置 为 value。 如 果 在 环境 中 name CAFE, IBA (a) Æ rewrite F 0, 
则 首先 删除 其 现 有 的 定义 ; Cb) d$ rewrite 为 0， 则 不 删除 其 现 有 定义 (name 不 设置 为 新 
的 value， 而 且 也 不 出 错 )。 

e unsetenv 删除 name 的 定义 。 即 使 不 存在 这 种 定义 也 不 算出 错 。 


注意 ，putenv 和 setenv 之 间 的 差别 。setenv 必须 分 配 存储 空间 ， 以 便 依 据 其 参数 创建 
name = value 字符 串 。putenv 可 以 自由 地 将 传递 给 它 的 参数 字符 串 直 接 放 到 环境 中 。 确 实 , 许多 
实现 就 是 这 么 做 的 ， 因 此 ， 将 存放 在 栈 中 的 字符 串 作 为 参数 传递 给 putenv 就 会 发 生 错误 ， 其 原 
因 是 ， 从 当前 函数 返回 时 ， 其 栈 帧 占用 的 存储 区 可 能 将 被 重用 。 


这 些 函数 在 修改 环境 表 时 是 如 何 进行 操作 的 呢 ? 对 这 一 问题 进行 研究 、 考 察 是 非常 有 益 的 。 
回忆 图 7-6， 其 中 ， 环 境 表 〈 指 向 实际 name-value 字符 串 的 指针 数组 ) 和 环境 字符 串通 常 存放 在 
进程 存储 空间 的 顶部 〈 栈 之 上 )。 删 除 一 个 字符 串 很 简单 一 一 只 要 先 在 环境 表 中 找到 该 指针 ， 然 
后 将 所 有 后 续 指 针 都 向 环境 表 首 部 顺 次 移动 一 个 位 置 。 但 是 增加 一 个 字符 串 或 修改 一 个 现 有 的 字 
符 串 就 困难 得 多 。 环 境 表 和 环境 字符 串通 常 占用 的 是 进程 地 址 空间 的 顶部 ， 所 以 它 不 能 再 向 高 地 
址 方向 (向 上 ) 扩展 : 同时 也 不 能 移动 在 它 之 下 的 各 栈 帧 ， 所 以 它 也 不 能 向 低地 址 方向 〈 向 下 ) 
扩展 。 两 者 组 合 使 得 该 空间 的 长 度 不 能 再 增加 。 
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(OD 如 果 修 改 一 个 现 有 的 name: 

a. 如 果 新 value 的 长 度 少 于 或 等 于 现 有 value 的 长 度 ， 则 只 要 将 新 字符 串 复制 到 原 字 符 串 所 
用 的 空间 中 ; 

b. 如 果 新 value 的 长 度 大 于 原 长 度 ， 则 必须 调用 malloc 为 新 字符 串 分 配 空间 ， 然 后 将 新 字 
符 串 复制 到 该 空间 中 ， 接 着 使 环境 表 中 针对 name 的 指针 指向 新 分 配 区 。 

(2) 如 果 要 增加 一 个 新 的 aame， 则 操作 就 更 加 复杂 。 首 先 ， 必 须 调 用 malloc 为 name-value 

字符 串 分 配 空间 ， 然 后 将 该 字符 串 复制 到 此 空间 中 。 

a， 如 果 这 是 第 一 次 增加 一 个 新 name， 则 必须 调用 malloc 为 新 的 指针 表 分 配 空间 。 接 着 ， 
将 原来 的 环境 表 复制 到 新 分 配 区 ， 并 将 指向 新 name-value 字符 串 的 指针 存放 在 该 指针 表 
的 表 尾 ， 然 后 又 将 一 个 空 指针 存放 在 其 后 。 最 后 使 environ 指向 新 指针 表 。 再 看 一 下 图 
7-6， 如 果 原 来 的 环境 表 位 于 栈 顶 之 上 (这 是 一 种 常见 情况 )， 那 么 必须 将 此 表 移 至 堆 中 。 
但 是 ， 此 表 中 的 大 多 数 指针 仍 指向 栈 顶 之 上 的 各 name=value 字符 串 。 

b. 如 果 这 不 是 第 一 次 增加 一 个 新 name， 则 可 知 以 前 已 调用 malloc 在 堆 中 为 环境 表 分 配 了 
空间 ， 所 以 只 要 调用 realloc， 以 分 配 比 原 空间 多 存放 一 个 指针 的 空间 。 然 后 将 指向 新 
name=value 字符 串 的 指针 存放 在 该 表 表 尾 ， 后 面 跟着 一 个 空 指针 。 


7.10 函数 setjmp 和 longjmp 


在 C 中 , goto 语句 是 不 能 跨越 函数 的 , 而 执行 这 种 类 型 跳 转 功能 的 是 函数 set jmp 和 longjmp. 
这 两 个 函数 对 于 处 理发 生 在 很 深层 据 套 函数 调用 中 的 出 错 情况 是 非常 有 用 的 。 
考虑 图 7-9 程序 的 骨架 部 分 。 其 主 循环 是 从 标准 输入 读 一 行 , 然后 调用 do line 处 理 该 输入 
fT. do line 函数 调用 get. token 从 该 输入 行 中 取 下 一 个 标记 。 一 行 中 的 第 一 个 标记 假定 是 一 
条 某 种 形式 的 命令 ，switch 语句 就 实现 命令 选择 。 对 程序 中 示例 的 命令 调用 cma. add 函数 。 


#include "apue.h" 


#define TOK_ADD 5 
void do_line(char *); 
void cmd add(void); 
int get token(void); 
int 


main(void) 
{ 
char line [MAXLINE] ; 


while (fgets(line, MAXLINE, stdin) != NULL) 
do_line (line); 
exit (0); 
} 
char *tok_ptr; /* global pointer for get_token() */ 
void 


do_line(char *ptr) /* process one line of input */ 
{ 
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int cmd; 


tok ptr = ptr; 


while ((cmd = get token()) > 0) { 
switch (cmd) { /* one case for each command */ 
case TOK_ADD: 
cmd add(); 
break; 
) 
} 
} 
void 


cmd_add (void) 
{ 


int token; 


token = get token(); 
/* rest of processing for this command */ 
} 


int 
get_token (void) 
{ 
/* fetch next token from line pointed to by tok_ptr */ 


} 
图 7-9 进行 命令 处 理 程序 的 典型 骨架 部 分 
图 7-9 的 程序 的 骨架 部 分 在 读 命令 、 确 定 命令 的 类 型 ， 然 后 调用 相应 函数 处 理 每 一 条 命令 这 
类 程序 中 是 非常 典型 的 。 图 7-10 显示 了 调用 了 cmd add 之 后 栈 的 大 致使 用 情况 。 


自动 变量 的 存储 单元 在 每 个 函数 的 栈 桢 中 。 数 组 gaes [ — — —À moet 
line 7E main 的 栈 帧 中 , 整 型 cmd 在 do line 的 栈 帧 | 
中 ， 整 型 token 在 cmd add 的 栈 帧 中 。 BM 

如 上 所 述 ， 这 种 形式 的 栈 安排 是 非常 典型 的 ， 但 并 
不 要 求 非 如 此 不 可 。 栈 并 不 一 定 要 向 低地 址 方向 扩充 。 ——— 
某 些 系统 对 栈 并 没有 提供 特殊 的 硬件 支持 ， 此 时 一 个 C mm 
实现 可 能 要 用 链表 实现 栈 帧 。 Se ae 

在 编写 图 7-9 这 样 的 程序 时 经 常会 遇 到 的 一 个 问题 "m 
是 ， 如 何 处 理 非 致命 性 的 错误 。 例 如 ， 若 cmd ada jg "YM | 

低地 址 








数 发 现 一 个 错误 (比如 一 个 无 效 的 数 ), 那么 它 可 能 先 打 
印 一 个 出 错 消息 ， 然 后 忽略 输入 行 的 余下 部 分 ， 返 回 。 图 7-10 调用 ema ada 后 的 各 个 栈 帧 
main 函数 并 读 下 一 输入 行 。 但 是 如 果 这 种 情况 出 现在 main 函数 中 的 深层 肉 套 层 中 时 ， 用 C 语 
言 难以 做 到 这 一 点 (在 本 例 中 ，cmqd_add 函数 只 比 main 低 两 个 层次 ， 在 有 些 程序 中 往往 低 5 个 
层次 或 更 多 )。 如 果 我 们 不 得 不 以 检查 返回 值 的 方法 逐 层 返回 ， 那 就 会 变 得 很 麻烦 。 

解决 这 种 问题 的 方法 就 是 使 用 非 局 部 goto 一 一 setjmp 和 longjmp 函数 。 非 局 部 指 的 是 ， 
这 不 是 由 普通 的 C 语言 goto 语句 在 一 个 函数 内 实施 的 跳 转 ， 而 是 在 栈 上 跳 过 若干 调用 帧 ， 返 回 
到 当前 函数 调用 路 径 上 的 某 一 个 函数 中 。 
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#include <setjmp.h> 


int setjmp(jmp_buf env); 


返回 值 : 若 直接 调 用 ， 返 回 0; 若 从 longjmp 返回 ， 则 为 非 0 





void longjmp(jmp_buf env, int val); 


在 希望 返回 到 的 位 置 调用 setjmp， 在 本 例 中 ， 此 位 置 在 main 函数 中 。 因 为 我 们 直接 调用 
该 函数 ， 所 以 其 返回 值 为 0。setjmp 参数 env 的 类 型 是 一 个 特殊 类 型 jmp_buf。 这 一 数据 类 型 
是 某 种 形式 的 数组 ， 其 中 存放 在 调用 longjmp 时 能 用 来 恢复 栈 状态 的 所 有 信息 。 因 为 需 在 另 一 
个 函数 中 引用 env 变量 ， 所 以 通常 将 env 变量 定义 为 全 局 变量 。 

当 检查 到 一 个 错误 时 ， 例 如 在 cmd_add 函数 中 ， 则 以 两 个 参数 调用 longjmp 函数 。 第 一 个 就 是 
在 调用 setjmp 时 所 用 的 env; 第 二 个 参数 是 具 非 0 值 的 val， 它 将 成 为 从 setjmp 处 返回 的 值 。 使 用 
第 二 个 参数 的 原因 是 对 于 一 个 setjmp 可 以 有 多 个 1ongjmp。 例 如 ， 可 以 在 cmd. add 中 以 val 为 1 Vi] 
用 longjmp， 也 可 在 get token PU val 为 2 调用 1ongjmp。 在 main 函数 中 ，setJjmp 的 返回 值 
就 会 是 1 或 2， 通 过 测试 返回 值 就 可 判断 造成 返回 的 1ongjmp 是 在 cmd. add 还 是 在 get. token "P. 

再 回 到 程序 实例 中 ， 图 7-11 中 给 出 了 经 修改 过 后 的 main 和 cmd add 函数 〈 其 他 两 个 函数 
do line 和 get_token 未 更 改 )。 


#include "apue.h" 
#include <setjmp.h> 


#define TOK_ADD 5 
jmp buf jmpbuffer; 
int 


main(void) 


{ 


char line [MAXLINE]; 
if (setjmp(jmpbuffer) != 0) 
printf ("error"); 
while (fgets(line, MAXLINE, stdin) != NULL) 
do_line (line); 
exit (0); 
} 
void 


cmd_add (void) 
{ 


int token; 


token = get_token(); 

if (token < 0) /* an error has occurred */ 
longjmp(jmpbuffer, 1); 

/* rest of processing for this command */ 


图 7-11 setjmp fil longjmp 实例 
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执行 main Hf, 调用 setjmp， 它 将 所 需 的 信息 记 入 变量 jmpbuffer 中 并 返回 0。 然 后 调用 


do line, 它 又 调用 cmd. add, 假定 在 其 中 检测 到 一 栈 的 底部 高 地 址 
个 错误 。 在 cmd add 中 调用 longjmp 之 前 ， 栈 如 
图 7-10 中 所 示 。 但 是 1ongjmp 使 栈 反 绕 到 执行 main main 的 栈 帧 


函数 时 的 情况 ， 也 就 是 抛弃 了 cmd_add 和 do_line 
的 栈 帧 〈 见 图 7-12)。 调 用 longjmp 造成 main 中 
setjmp 的 返回 ， 但 是 ， 这 一 次 的 返回 值 是 1 
(longjmp 的 第 二 个 参数 )。 
1， 自 动 变量 、 寄 存 器 变量 和 易 失 变量 armana 
我 们 已 经 了 解 在 调用 longjmp 后 栈 帧 的 基本 结 低地 址 
构 ， 下 一 个 问题 是 :“ 在 main 函数 中 ， 自 动 变量 和 寄 图 7-12 在 调用 1ongjmp 后 的 栈 帧 
存 器 变量 的 状态 如 何 ? ” 当 long jmp 返回 到 main 函数 时 ， 这 些 变 量 的 值 是 否 能 恢复 到 以 前 调 
用 setjmp 时 的 值 ( 即 回 滚 到 原先 值 ), 或 者 这 些 变量 的 值 保 持 为 调用 do line 时 的 值 (do_line 
调用 cmd add. cmd add 又 调用 longjmp) ? 遗憾 的 是 ， 对 此 问题 的 回答 是 “看 情况 ” 大 多 
数 实现 并 不 回 滚 这 些 自动 变量 和 寄存 器 变量 的 值 ， 而 所 有 标准 则 称 它们 的 值 是 不 确定 的 。 如 果 你 
有 一 个 自动 变量 ， 而 又 不 想 使 其 值 回 滚 ， 则 可 定义 其 为 具有 volatile 属性 。 声 明 为 全 局 变量 或 
静态 变量 的 值 在 执行 Longjmp 时 保持 不 变 。 








加 实例 
下 面 我 们 通过 图 7-13 程序 说 明 在 调用 Longjmp 后 ， 自 动 变量 、 全 局 变量 、 寄 存 器 变量 、 静 
态 变量 和 易 失 变量 的 不 同情 况 。 


#include "apue.h" 
#include <setjmp.h> 


static yoid £1 (int, int, int, int); 
static void  f2(void) 7 


static jmp buf jmpbuffer; 
static int globval; 


int 
main(void) 


{ 


int autoval; 
register int regival; 
volatile int volaval; 
static int statval; 


globval = 1; autoval = 2; regival = 3; volaval = 4; statval = 5; 


rh 


if (setjmp(jmpbuffer) != 0) { 

printf ("after longjmp:\n"); 

printf ("globval = %d, autoval = $d, regival = %d," 
" volaval = $d, statval = %d\n", 
globval, autoval, regival, volaval, statval); 


exit (0); 
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} 


/* 

* Change variables after setjmp, but before longjmp. 
*J 

globval 95; autoval = 96; regival = 97; volaval = 98; 


statval - 99; 


fl(autoval, regival, volaval, statval); /* never returns */ 
exit (0); 
} 


static void 
fi (int. i, int j, int k, int 1) 
{ 
printf("in f1():X3n"); 
printf("globval = %d, autoval = $d, regival = $d," 
" volaval = $d, statval = %d\n", globval, i, j; K, 1); 
£2(); 
) 


static void 
£2 (void) 
{ 
longjmp(jmpbuffer, 1); 
} 


图 7-13 longjmp 对 各 类 变量 的 影响 
如 果 以 不 带 优化 和 带 优化 选项 对 此 程序 分 别 进行 编译 ， 然 后 运行 它们 ， 则 得 到 的 结果 是 不 同 的 : 


$ gcc testjmp.c 不 进行 任何 优化 的 编译 
$ ./a.out 
in £1(): 


globval = 95, autoval = 96, regival = 97, volaval = 98, statval = 99 
after longjmp: 
globval = 95, autoval = 96, regival = 97, volaval = 98, statval = 99 


$ gcc -O testjmp.c 进行 全 部 优化 的 编译 
$ ./a.out 
in £110) 


globval = 95, autoval = 96, regival = 97, volaval = 98, statval = 99 
after longjmp: 
globval = 95, autoval = 2, regival = 3, volaval = 98, statval = 99 


注意 ， 全 局 变量 、 静 态 变量 和 易 失 变量 不 受 优化 的 影响 ， 在 longjmp 之 后 ， 它 们 的 值 是 最 近 所 
呈现 的 值 。 在 某 个 系统 的 setjmp(3) 手 册页 上 说 明 ， 存 放 在 存储 器 中 的 变量 将 具有 longjmp 时 
的 值 ， 而 在 CPU 和 浮 点 寄存 器 中 的 变量 则 恢复 为 调用 setjmp 时 的 值 。 这 确实 就 是 运行 图 7-13 FE 
序 时 所 观察 到 的 值 。 不 进行 优化 时 ， 所 有 这 5 个 变量 都 存放 在 存储 器 中 《〈 即 忽略 了 对 regival 变量 
的 register 存储 类 说 明 )。 而 进行 了 优化 后 ，autoval 和 regival 都 存放 在 寄存 器 中 (即使 
autoval 并 未 说 明 为 register), volatile 变量 则 仍 存放 在 存储 器 中 。 通 过 这 一 实例 我 们 可 
以 理解 和 到， 如 果 要 编写 一 个 使 用 非 局 部 跳 转 的 可 移植 程序 ， 则 必须 使 用 volatile 属性 。 但 是 从 
一 个 系统 移植 到 另 一 个 系统 ， 其 他 任何 事情 都 可 能 改变 。 

在 图 7-13 P, 某 些 printf 的 格式 字符 串 可 能 不 适宜 安排 在 程序 文本 的 一 行 中 。 我 们 没有 将 
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其 分 成 多 个 printf 调用 ， 而 是 使 用 了 ISOC 的 字符 串 连接 功能 ， 于 是 两 个 字符 串 序列 
"stringl" "string2" 
等 价 于 
"stringlstring2" z 
第 10 章 讨论 信号 处 理 程序 及 sigsetjmp 和 siglongjmp 时 ， 将 再 次 涉及 setjmp 和 longjmp 
函数 。 
2 自动 变量 的 潜在 问题 
前 面 已 经 说 明了 处 理 栈 帧 的 一 般 方式 ， 现 在 值得 分 析 一 下 自动 变量 的 一 个 潜在 出 错 情况 。 基 
本 规则 是 声明 自动 变量 的 函数 已 经 返回 后 ， 不 能 再 引用 这 些 自动 变量 。 在 整个 UNIX 手册 中 ， 关 
于 这 一 点 有 很 多 警告 。 
图 7-14 中 给 出 了 一 个 名 为 open_qata 的 函数 ， 它 打开 了 一 个 标准 VO 流 ， 然 后 为 该 流 设置 缓冲 。[219] 


#include <stdio.h> 


FILE * 
open_data (void) 
{ 
FILE *fp; 
Char databuf[BUFSIZ]; /* setvbuf makes this the stdio buffer */ 


if ((fp = fopen("datafile", "r")) == NULL) 
return (NULL); 

if (setvbuf(fp, databuf,  IOLBF, BUFSIZ) != 0) 
return (NULL); 

return(fp); * error */ 


图 7-14 自动 变量 的 不 正确 使 用 
问题 是 : 当 open_data 返回 时 , 它 在 栈 上 所 使 用 的 空间 将 由 下 一 个 被 调用 函数 的 栈 帧 使 用 。 
但 是 ， 标 准 IO 库 函 数 仍 将 使 用 这 部 分 存储 空间 作为 该 流 的 缓冲 区 。 这 就 产生 了 冲突 和 混乱 。 为 
了 改正 这 一 问题 ， 应 在 全 局 存储 空间 静态 地 (如 static Mextern) 或 者 动态 地 (使 用 一 种 alloc 
函数 ) 为 数组 databuf 分 配 空间 。 
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每 个 进程 都 有 一 组 资源 限制 , 其 中 一 些 可 以 用 getrlimit 和 setrlimit 函数 查询 和 更 改 。 


#include <sys/resource.h> 





int getrlimit(int resource, struct rlimit *riptr); 


int setrlimit(int resource, const struct rlimit *rlptr); 


两 个 函数 返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 非 0 





这 两 个 函数 在 Single UNIX Specification 的 XSI 扩展 中 定义 。 进 程 的 资源 限制 通常 是 在 系统 初始 
化 时 由 0 进程 建立 的 ， 然 后 由 后 续 进 程 继承 。 每 种 实现 都 可 以 用 自己 的 方法 对 资源 限制 做 出 调整 。 


对 这 两 个 函数 的 每 一 次 调用 都 指定 一 个 资源 以 及 一 个 指向 下 列 结构 的 指针 。 


[220] 
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struct rlimit { 
riim t rlim cur; 
rlim t rlim max; 


) 


/* soft limit: current limit */ 
/* hard limit: maximum value for rlim cur */ 


在 更 改 资源 限制 时 ， 须 遵循 下 列 3 条 规则 。 
(1) 任何 一 个 进程 都 可 将 一 个 软 限制 值 更 改 为 小 于 或 等 于 其 硬 限制 值 。 
(2) 任何 一 个 进程 都 可 降低 其 硬 限制 值 ， 但 它 必 须 大 于 或 等 于 其 软 限制 值 。 这 种 降低 ， 对 普 


通用 户 而 言 是 不 可 逆 的 。 


(3) 只 有 超级 用 户 进程 可 以 提高 硬 限 制 值 。 
常量 RLIM_INFINITY 指定 了 一 个 无 限量 的 限制 。 
这 两 个 函数 的 resource 参数 取 下 列 值 之 一 。 图 7-15 显示 哪些 资源 限制 是 由 Single UNIX 


Specification 定义 并 由 本 书 讨论 的 4 种 UNIX 系统 实现 支持 的 。 


FreeBSD 8.0 Linux 3.2.0 Mac OS X 10.6.8 Solaris 10 


RLIMIT_AS 
RLIMIT_CORE 
RLIMIT_CPU 
RLIMIT_DATA 
RLIMIT_FSIZE 
RLIMIT_MEMLOCK 
RLIMIT_MSGQUEUE 
RLIMIT_NICE 
RLIMIT_NOFILE 
RLIMIT_NPROC 
RLIMIT_NPTS 
RLIMIT_RSS 
RLIMIT_SBSIZE 
RLIMIT_SIGPENDING 
RLIMIT_STACK 
RLIMIT_SWAP 
RLIMIT_VMEM 


RLIMIT_AS 


RLIMIT CORE 
RLIMIT CPU 


RLIMIT DATA 


RLIMIT FSIZE 


RLIMIT MEMLOCK 


RLIMIT MSGQUEUE 
RLIMIT NICE 








图 7-15. ”对 资源 限制 的 支持 


进程 总 的 可 用 存储 空间 的 最 大 长 度 〈 字 节 )。 这 影响 到 sork 函数 
(1.11 节 ) 和 mmap 函数 (14.8 节 )。 

core 文件 的 最 大 字 节 数 ， 若 其 值 为 0 则 阻止 创建 core 文件 。 

CPU 时 间 的 最 大 量 值 ( 秒 ), 当 超 过 此 软 限制 时 , 向 该 进程 发 送 SIGXCPU 
信号。 

数据 段 的 最 大 字 节 长 度 。 这 是 图 7-6 中 初始 化 数据 、 非 初始 以 及 堆 
的 总 和 。 

可 以 创建 的 文件 的 最 大 字 节 长 度 。 当 超过 此 软 限制 时 ， 则 向 该 进程 
发 送 SIGXFSZ 信号 。 

一 个 进程 使 用 mlock(2) 能 够 锁定 在 存储 空间 中 的 最 大 字 节 长 度 。 
进程 为 POSIX 消息 队列 可 分 配 的 最 大 存储 字 节 数 。 

为 了 影响 进程 的 调度 优先 级 ，nice fü. (8.16 节 ) 可 设置 的 最 大 限制 。 
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RLIMIT NOFILE 每 个 进程 能 打开 的 最 多 文件 数 。 更 改 此 限制 将 影响 到 syscont 函数 
在 参数 sC OPEN MAX 中 返回 的 值 ( 见 2.5.4 节 )， 亦 见 图 2-17。 


RLIMIT_NPROC 每 个 实际 用 户 ID 可 拥有 的 最 大 子 进程 数 。 更 改 此 限制 将 影响 到 
sysconf 函数 在 参数 _sc_cHILD MAX 中 返回 的 值 ( 见 2.5.4 节 )。 

RLIMIT_NPTS 用 户 可 同时 打开 的 伪 终 端 ( 第 19 章 ) 的 最 大 数量 。 

RLIMIT RSS 最 大 驻 内 存 集 字 节 长 度 (resident set size in bytes，RSS)。 如 果 可 用 


的 物理 存储 器 非常 少 ， 则 内 核 将 从 进程 处 取 回 超过 RSS 的 部 分 。 
RLIMIT SBSIZE 在 任 一 给 定时 刻 ， 一 个 用 户 可 以 占用 的 套 接 字 缓冲 区 的 最 大 长 度 


GET. 

RLIMIT SIGPENDING 一 个 进程 可 排队 的 信号 最 大 数量 。 这 个 限制 是 sigqueue 函数 实施 
的 (10.20 节 )。 

RLIMIT_STACK 栈 的 最 大 字 节 长 度 。 见 图 7-6。 

RLIMIT_SWAP 用 户 可 消耗 的 交换 空间 的 最 大 字 节 数 

RLIMIT_VMEM 这 是 RLIMIT_AS 的 同义词 。 


资源 限制 影响 到 调用 进程 并 由 其 子 进程 继承 。 这 就 意味 着 ， 为 了 影响 一 个 用 户 的 所 有 后 续 进 
程 ， 需 将 资源 限制 的 设置 构造 在 shell 之 中 。 确 实 ，Bourne shell, GNU Bourne-again shell 和 Korn 
shell 具有 内 置 的 ulimit 命令 ，C shell RAW limit MẸ. Cumask 和 chdir 函数 也 必须 是 
shell Pj AY). ) 


PEALE 
图 7-16 的 程序 打印 由 系统 支持 的 所 有 资源 当前 的 软 限 制 和 硬 限制 .为 了 在 各 种 实现 上 编译 该 [221 
程序 ,我 们 已 经 条 件 地 包括 了 各 种 不 同 的 资源 名 ,注意 ,有 些 平台 定义 rlim t 为 unsigned long RA 
long 而 非 unsigned long。 在 同一 系统 中 这 个 定义 可 能 也 会 变动 ， 这 取决 于 我 们 在 编译 程序 
候 是 否 支 持 64 位 文件 。 有 些 限制 作用 于 文件 大 小 ， 因 此 rlim t 类 型 必须 足够 大 才能 表示 文件 
大 小 限制 。 为 了 避免 使 用 错误 的 格式 说 明 而 导致 编译 器 警告 ， 通 常会 首先 把 限制 复制 到 64 位 整 
型 ， 这 样 只 需 处 理 一 种 格式 。 


#include "apue.h" 
#include <sys/resource.h> 


#define doit (name) pr_limits(#name, name) 
static void pr_limits(char *, int); 


int 

main (void) 

{ 

#ifdef RLIMIT_AS 
doit (RLIMIT_AS) ; 

#endif 


doit (RLIMIT_CORE) ; 
doit (RLIMIT_CPU) ; 

doit (RLIMIT_DATA) ; 
doit (RLIMIT_FSIZE) ; 
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#ifdef RLIMIT_MEMLOCK 
doit (RLIMIT_MEMLOCK) ; 
#endif 


#ifdef RLIMIT_MSGQUEUE 
doit (RLIMIT_MSGQUEUE) ; 
#tendif 


#ifdef RLIMIT_NICE 
doit(RLIMIT NICE); 
fendif 


doit (RLIMIT_NOFILE) ; 


#ifdef RLIMIT_NPROC 
doit (RLIMIT_NPROC) ; 
#endif 


#ifdef RLIMIT_NPTS 
doit (RLIMIT_NPTS) ; 
#endif 


#ifdef | RLIMIT_RSS 
doit (RLIMIT_RSS) ; 
#tendif 


#ifdef RLIMIT_SBSIZE 
doit (RLIMIT_SBSIZE) ; 
#endif 


#ifdef RLIMIT_SIGPENDING 
doit (RLIMIT_SIGPENDING) ; 
#endif 


doit (RLIMIT_STACK) ; 


#ifdef RLIMIT_SWAP 
doit (RLIMIT_SWAP) ; 
#endif 


#ifdef RLIMIT_VMEM 
doit (RLIMIT_VMEM) ; 
#endif 


exit (0); 


static void 
pr_limits(char *name, int resource) 
{ 
struct rlimit limit; 
unsigned long long lim; 


if (getrlimit (resource, &limit) 





< 0) 





err sys("getrlimit error for %s", 


printf("$-14s ", name); 


name); 


if (limit.rlim cur == RLIM INFINITY) { 
printf("(infinite) "); 

} else { 
lim = limit.rlim_cur; 
printf("$101ld ", lim); 

} 

if (limit.rlim_max == RLIM_INFINITY) { 
printf (" (infinite)"); 

) else { 


lim = limit.rlim max; 
printf("*1011d", lim); 


} 
putchar ( (int) '\n'); 


图 7-16 打印 当前 资源 限制 
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注意 , 在 doit 宏 中 使 用 了 ISO C 的 字符 串 创 建 算 符 GO, DEA BES EUR PAESE FB. 


例如 : 


doit (RLIMIT_CORE) ; 


这 将 由 C 预 处 理 程序 扩展 为 : 
pr limits ("RLIMIT_CORE", 


在 FreeBSD 下 运行 此 程序 ， 得 到 : 


$ ./a.out 

RLIMIT_AS (infinite) 
RLIMIT_CORE (infinite) 
RLIMIT_CPU (infinite) 
RLIMIT_DATA 536870912 
RLIMIT_FSIZE (infinite) 
RLIMIT_MEMLOCK (infinite) 
RLIMIT_NOFILE 3520 
RLIMIT_NPROC 1760 
RLIMIT_NPTS (infinite) 
RLIMIT_RSS (infinite) 
RLIMIT_SBSIZE (infinite) 
RLIMIT_STACK 67108864 
RLIMIT_SWAP (infinite) 
RLIMIT_VMEM (infinite) 


在 Solaris 下 运行 此 程序 ， 得 到 : 


$ ./a.out 

RLIMIT AS (infinite) 
RLIMIT CORE (infinite) 
RLIMIT CPU (infinite) 
RLIMIT DATA (infinite) 
RLIMIT FSIZE (infinite) 
RLIMIT NOFILE 256 
RLIMIT STACK 8388608 
RLIMIT VMEM (infinite) 


RLIMIT CORE); 


(infinite) 
(infinite) 
(infinite) 
536870912 
(infinite) 
(infinite) 
3520 
1760 
(infinite) 
(infinite) 
(infinite) 
67108864 
(infinite) 
(infinite) 


(infinite) 
(infinite) 
(infinite) 
(infinite) 
(infinite) 

65536 
(infinite) 
(infinite) 
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在 介绍 了 信号 机 制 后 ， 习 题 10.11 将 继续 讨论 资源 限制 。 
7.12 ”小结 


理解 UNIX 系统 环境 中 C 程序 的 环境 是 理解 UNIX 系统 进程 控制 特性 的 先决 条 件 。 本 章 说 明 
了 一 个 进程 是 如 何 启动 和 终止 的 ， 如 何 向 其 传递 参数 表 和 环境 。 虽 然 参数 表 和 环境 都 不 是 由 内 核 
进行 解释 的 ， 但 内 核 起 到 了 从 exec 的 调用 者 将 这 两 者 传递 给 新 进程 的 作用 。 

本 章 也 说 明了 C 程序 的 典型 存储 空间 布局 ， 以 及 一 个 进程 如 何 动态 地 分 配 和 释放 存储 空间 。 
详细 地 了 解 用 于 维护 环境 的 一 些 函 数 是 有 意义 的 ， 因 为 它们 涉及 存储 空间 分 配 。 本 章 也 介绍 了 
setjmp 和 longjmp 函数 ， 它 们 提供 了 一 种 在 进程 内 非 局 部 转移 的 方法 。 最 后 介绍 了 各 种 实现 


提供 的 资源 限制 功能 。 
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习题 


7.1 Æ Intel x86 系统 上 ， 使 用 Linux， 如 果 执 行 一 个 输出 “hello, world” 的 程序 但 不 调用 exit 
或 return， 则 程序 的 返回 代码 为 13 CH shell 检查 )， 解 释 其 原因 。 
72 图 7-3 中 的 printf 函数 的 结果 何 时 才 被 真正 输出 ? 
7.3 ”是 否 有 方法 不 使 用 (a) 参数 传递 、(b) 全 局 变量 这 两 种 方法 ， 将 main 中 的 参数 arge 和 
argv 传递 给 它 所 调用 的 其 他 函数 ? 
7.4 ”在 有 些 UNIX 系统 实现 中 执行 程序 时 访问 不 到 其 数据 段 的 0 单元 ， 这 是 一 种 有 意 的 安排 ， 
为 什么 ? 
7.5 用 C 语言 的 typedef 为 终止 处 理 程序 定义 了 一 个 新 的 数据 类 型 Exitfunc, 使 用 该 类 型 修 
改 atexit 的 原型 。 
7.6 ”如 果 用 calloc 分 配 一 个 long 型 的 数组 , 数组 的 初始 值 是 否 为 0? 如 果 用 calloc 分 配 一 
个 指针 数组 ， 数 组 的 初始 值 是 否 为 空 指针 ? 
77 在 7.6 节 结尾 处 size 命令 的 输出 结果 中 ， 为 什么 没有 给 出 堆 和 栈 的 大 小 ? 
7.8 ”为 什么 7.7 节 中 两 个 文件 的 大 小 (879 443 和 8378) 不 等 于 它们 各 自 文本 和 数据 大 小 的 和 ? 
7.9 “为 什么 7.7 节 中 对 于 一 个 简单 的 程序 ， 使 用 共享 库 以 后 其 可 执行 文件 的 大 小 变化 如 此 巨大 ? 
7.10 在 7.10 节 中 我 们 已 经 说 明 为 什么 不 能 将 一 个 指针 返回 给 一 个 自动 变量 ， 下 面 的 程序 是 否 正确 ? 
int 
fl(int val) 
{ 
int num = 0; 
int *ptr = &num; 
if (val == 0) { 
int val; 
val = 5; 
ptr = &val; 
} 


return(*ptr + 1); 


} 


第 8 ni 
进程 控制 





8.1 引言 


本 章 介绍 UNIX 系统 的 进程 控制 ， 包 括 创 建新 进程 、 执 行程 序 和 进程 终止 。 还 将 说 明 进 程 属 
性 的 各 种 ID 一 一 实际 、 有 效 和 保存 的 用 户 ID 和 组 ID， 以 及 它们 如 何 受到 进程 控制 原 语 的 影响 。 
本 章 还 包括 了 解释 器 文件 和 system 函数 。 本 章 最 后 讲述 大 多 数 UNIX 系统 所 提供 的 进程 会 计 机 
制 ， 这 种 机 制 使 我 们 能 够 从 另 一 个 角度 了 解 进程 的 控制 功能 。 


8.2 ”进程 标识 


每 个 进程 都 有 一 个 非 负 整 型 表示 的 唯一 进程 ID。 因 为 进程 ID 标识 符 总 是 唯一 的 ， 常 将 其 用 
作 其 他 标识 符 的 一 部 分 以 保证 其 唯一 性 。 例 如 ， 应 用 程序 有 时 就 把 进程 ID 作为 名 字 的 一 部 分 来 
创建 一 个 唯一 的 文件 名 。 

虽然 是 唯一 的 ， 但 是 进程 ID 是 可 复 用 的 。 当 一 个 进程 终止 后 ， 其 进程 ID 就 成 为 复 用 的 候选 
者 。 大 多 数 UNIX 系统 实现 延迟 复 用 算法 ， 使 得 赋予 新 建 进 程 的 ID 不 同 于 最 近 终止 进程 所 使 用 
的 ID。 这 防止 了 将 新 进程 误 认 为 是 使 用 同一 ID 的 某 个 已 终止 的 先前 进程 。 

系统 中 有 一 些 专用 进程 ， 但 具体 细节 随 实现 而 不 同 。ID 为 0 的 进程 通常 是 调度 进程 ， 常 
常 被 称 为 交换 进程 (swapper)。 该 进程 是 内 核 的 一 部 分 ， 它 并 不 执行 任何 磁盘 上 的 程序 ， 因 此 
也 被 称 为 系统 进程 。 进 程 ID 1 通常 是 init 进程 ， 在 自 举 过 程 结 束 时 由 内 核 调 用 。 该 进程 的 
程序 文件 在 UNIX 的 早期 版 本 中 是 /etc/init， 在 较 新 版 本 中 是 /sbin/init。 此 进程 负责 
在 自 举 内 核 后 启动 一 个 UNIX 系统 。init 通常 读 取 与 系统 有 关 的 初始 化 文件 (/etc/rc* 文 
件 或 /etc/inittab 文件 ， 以 及 在 /etc/init .qd 中 的 文件 )， 并 将 系统 引导 到 一 个 状态 (如 
ZAP). init 进程 决 不 会 终止 。 它 是 一 个 普通 的 用 户 进程 (与 交换 进程 不 同 ， 它 不 是 内 核 
中 的 系统 进程 ;， 但 是 它 以 超级 用 户 特权 运行 。 本 章 稍 后 部 分 会 说 明 init 如 何 成 为 所 有 孤儿 

Æ Mac OS X 10.4 中 ，init Fik launchd 进程 替代 ， 执 行 的 任务 集 与 init MA, 47 
展 了 功能 。 可 参阅 Singh[2006] 在 5.10 节 中 的 讨论 来 了 解 launchd 是 如 何 操作 的 。 


每 个 UNIX 系统 实现 都 有 它 自己 的 一 套 提 供 操作 系统 服务 的 内 核 进程 ， 例 如 ， 在 某 些 UNIX 


的 虚拟 存储 器 实现 中 ， 进 程 ID 2 是 页 守护 进程 (page daemon)， 此 进程 负责 支持 虚拟 存储 器 系统 
的 分 页 操作 。 
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除了 进程 ID， 每 个 进程 还 有 一 些 其 他 标识 符 。 下 列 函 数 返 回 这 些 标 识 符 。 
#include <unistd.h> 
pid t getpid(void); 


返回 值 ， 调 用 进程 的 进程 ID 
pid t getppid(void); 


返回 值 : 调用 进程 的 父 进程 ID 


uid_t getuid(void); 

返回 值 ; 调用 进程 的 实际 用 户 ID 
uid t geteuid(void); 

返回 值 : 调用 进程 的 有 效用 户 ID 
gid t getgid(void); 


返回 值 : 调用 进程 的 实际 组 ID 
gid_t getegid(void); 
返回 值 : 调用 进程 的 有 效 组 ID 


注意 ， 这 些 函数 都 没有 出 错 返 回 ， 在 下 一 节 讨 论 fork 函数 时 ， 将 进一步 讨论 父 进 程 ID。 在 
4.4 节 中 已 讨论 了 实际 和 有 效用 户 ID 及 组 ID。 





8.3 PAR fork 


一 个 现 有 的 进程 可 以 调用 fork 函数 创建 一 个 新 进程 。 


#include <unistd.h> 


pid t fork (void); 


返回 值 : 子 进程 返回 0， 父 进程 返回 子 进程 ID; Ate, BE- 





由 fork 创建 的 新 进程 被 称 为 子 进程 (child process). fork 函数 被 调用 一 次 ， 但 返回 两 
次 。 两 次 返回 的 区 别 是 子 进程 的 返回 值 是 0， 而 父 进程 的 返回 值 则 是 新 建 子 进程 的 进程 ID. 
将 子 进程 ID 返回 给 父 进程 的 理由 是 : 因为 一 个 进程 的 子 进程 可 以 有 多 个 ， 并 且 没 有 一 个 函数 
使 一 个 进程 可 以 获得 其 所 有 子 进程 的 进程 ID. fork 使 子 进 程 得 到 返回 值 0 的 理由 是 : 一 个 
进程 只 会 有 一 个 父 进程 ， 所 以 子 进程 总 是 可 以 调用 getppid 以 获得 其 父 进程 的 进程 ID GE 
程 ID 0 总 是 由 内 核 交 换 进 程 使 用 ， 所 以 一 个 子 进 程 的 进程 ID 不 可 能 为 0)。 

子 进 程 和 父 进程 继续 执行 fork 调用 之 后 的 指令 。 子 进程 是 父 进程 的 副本 。 例 如 ， 子 进程 获 
得 父 进程 数据 空间 、 堆 和 栈 的 副本 。 注 意 ， 这 是 子 进程 所 拥有 的 副本 。 父 进程 和 子 进程 并 不 共享 
这 些 存储 空间 部 分 。 父 进程 和 子 进程 共享 正文 段 ( 见 7.6 节 )。 

由 于 在 fork 之 后 经 常 跟随 着 exec, 所 以 现在 的 很 多 实现 并 不 执行 一 个 父 进程 数据 段 、 
栈 和 堆 的 完全 副本 。 作 为 替代 ， 使 用 了 写 时 复制 (Copy-On-Write, COW) 技术 。 这 些 区 域 
由 父 进程 和 子 进程 共享 ， 而 且 内 核 将 它们 的 访问 权限 改变 为 只 读 。 如 果 父 进程 和 子 进 程 中 的 
任 一 个 试图 修改 这 些 区 域 , 则 内 核 只 为 修改 区 域 的 那 块 内 存 制作 一 个 副本 , 通常 是 虚拟 存储 
系统 中 的 一 “页 ”。Bach[1986] 的 9.2 节 和 McKusick 等 [1996] 的 5.6 节 和 5.7 节 对 这 种 特征 
做 了 更 详细 的 说 明 。 
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某 些 平台 提供 fork 水 数 的 几 种 变 体 。 本 书 讨论 的 4 种 平台 都 支持 下 节 将 要 讨论 的 Vfork(2)。 

Linux 3.2.0 提供 了 另 一 种 新 进程 创建 函数 clone(2) 系 统 调用 。 这 是 一 种 fork 的 推广 
形式 ， 它 允许 调用 者 控制 哪些 部 分 由 父 进程 和 子 进程 共享 。 

FreeBSD 8.0 提供 了 rfork(2) 系 统 调用 , CHMT Linux 的 clone 系统 调用 。rfork 调用 是 
从 Plan 9 操作 系统 ( Pike 等 [1995] ) 派生 出 来 的 。 

Solaris 10 提供 了 两 个 线程 库 : 一 个 用 于 POSIX 线程 (pthreads )， 另 一 个 用 于 Solaris 线程 。 
在 这 两 个 线程 库 中 ，fork 的 行为 有 所 不 同 。 对 于 POSIX 线程 ，fork 创建 一 个 进程 ， 它 仅 包含 
调用 该 fork 的 线程 ， 但 对 于 Solaris 线程 ，fork 创建 的 进程 包含 了 调用 线程 所 在 进程 的 所 有 线 
程 的 副本 。 在 Solaris 10 中 ， 这 种 行为 改变 了 。 不 管 使 用 哪 种 线程 库 ，fork 创建 的 子 进程 只 保留 
调用 线程 的 副本 。Solaris 也 提供 了 forkl 函数 ， 它 创建 的 进程 只 复制 调用 线程 。 还 有 forkall 
函数 ， 它 创建 的 进程 复制 了 进程 中 所 有 的 线程 。 第 11 章 和 第 12 章 将 详细 讨论 线程 。 229 





严实 例 


图 8-1 程序 演示 了 fork 函数 ， 从 中 可 以 看 到 子 进程 对 变量 所 做 的 改变 并 不 影响 父 进程 中 该 


变量 的 值 。 

#include "apue.h" 

int globvar = 6; /* external variable in initialized data */ 
charbuf[] = "a write to stdout\n"; 

int 


main (void) 


{ 


int var; /* automatic variable on the stack */ 
pid_t pid; 


var = 88; 

if (write (STDOUT_FILENO, buf, sizeof (buf)-1) != sizeof (buf)-1) 
err_sys("write error"); 

printf ("before fork\n");  /* we don't flush stdout */ 


if ((pid = fork()) < 0) { 
err_sys("fork error"); 


) else if (pid == 0) { £/* child */ 
globvar++; /* modify variables */ 
var++; 

} else { 
sleep (2); /* parent */ 


} 


printf("pid = %ld, glob = %d, var = %d\n", (long)getpid(), globvar, 
var); 
exit (0); 





图 8-1 fork 函数 实例 
如 果 执 行 此 程序 则 得 到 : 
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$ ./a.out 

a write to stdout 

before fork 

pid = 430, glob = 7, var = 89 ” 子 进 程 的 变量 值 改变 了 
pid = 429, glob = 6, var = 88 父 进 程 的 变量 值 没有 改变 
$ a.out > temp.out 

$ cat temp.out 

a write to stdout 

before fork 

pid = 432, glob = 7, var = 89 

before fork 

pid = 431, glob = 6, var = 88 


一 般 来 说 ， 在 fork 之 后 是 父 进程 先 执行 还 是 子 进程 先 执行 是 不 确定 的 ， 这 取决 于 内 核 所 使 

用 的 调度 算法 。 如果 要 求 父 进程 和 子 进程 之 间 相互 同步 , 则 要 求 某 种 形式 的 进程 间 通 信 。 在 图 8-1 
程序 中 ， 父 进程 使 自己 休眠 2s， 以 此 使 子 进程 先 执 行 。 但 并 不 保证 2s 已 经 足够 ， 在 8.9 节 讲 述 

竟 争 条 件 时 还 将 谈 及 这 一 问题 及 其 他 类 型 的 同步 方法 。 在 10.16 节 中 ， 我 们 将 说 明 在 fork 之 后 
如 何 使 用 信号 使 父 进程 和 子 进 程 同步 。 

当 写 标准 输出 时 ， 我 们 将 buf 长 度 减 去 1 作为 输出 字 节 数 ， 这 是 为 了 避免 将 终止 null 字 
节 写 出 。strlen 计算 不 包含 终止 null 字 节 的 字符 串 长 度 ， 而 sizeof 则 计算 包括 终止 null 
字 节 的 缓冲 区 长 度 。 两 者 之 间 的 另 一 个 差别 是 ， 使 用 strlen 需 进行 一 次 函数 调用 ， 而 对 于 
sizeof 而 言 ， 因 为 缓冲 区 已 用 已 知 字符 串 进 行 初始 化 ， 其 长 度 是 固定 的 ， 所 以 sizeof 是 
在 编译 时 计算 缓冲 区 长 度 。 

注意 图 8-1 所 示 的 程序 中 fork 与 IO 函数 之 间 的 交互 关系 。 回 忆 第 3 章 中 所 述 ，write Hi 
数 是 不 带 缓冲 的 。 因 为 在 fork 之 前 调用 write, 所 以 其 数据 写 到 标准 输出 一 次 。 但 是 , 标准 VO 
库 是 带 缓冲 的 。 回 忆 一 下 5.12 节 ， 如 果 标 准 输出 连 到 终端 设备 ， 则 它 是 行 缓冲 的 ， 否 则 它 是 全 组 
冲 的 。 当 以 交互 方式 运行 该 程序 时 ， 只 得 到 该 printf 输出 的 行 一 次 ， 其 原因 是 标准 输出 缓冲 区 
由 换行 符 冲洗 。 但 是 当 将 标准 输出 重 定 向 到 一 个 文件 时 , 却 得 到 printf 输出 行 两 次 。 其 原因 是 ， 
在 fork 之 前 调用 了 printf 一 次 ， 但 当 调用 fork 时 ， 该 行 数据 仍 在 缓冲 区 中 ， 然 后 在 将 父 进 
程 数据 空间 复制 到 子 进程 中 时 ， 该 缓冲 区 数据 也 被 复制 到 子 进程 中 ， 此 时 父 进程 和 子 进程 各 自 有 
了 带 该 行内 容 的 缓冲 区 。 在 exit 之 前 的 第 二 个 printf 将 其 数据 追加 到 已 有 的 缓冲 区 中 。 当 每 
个 进程 终止 时 ， 其 缓冲 区 中 的 内 容 都 被 写 到 相应 文件 中 。 a 

文件 共享 

对 图 8-1 程序 需 注意 的 另 一 点 是 : 在 重 定向 父 进程 的 标准 输出 时 ， 子 进程 的 标准 输出 也 被 重 定向 。 
实际 上 ，fork 的 一 个 特性 是 父 进程 的 所 有 打开 文件 描述 符 都 被 复制 到 子 进程 中 。 我 们 说 “复制 ” 
是 因为 对 每 个 文件 描述 符 来 说 , 就 好 像 执行 了 dup 函数 。 父 进程 和 子 进程 每 个 相同 的 打开 描述 符 
共享 一 个 文件 表 项 〈 见 图 3-9)。 

考虑 下 述 情况 ,一 个 进程 具有 3 个 不 同 的 打开 文件 , 它们 是 标准 输入 、 标 准 输出 和 标准 错误 。 
在 从 fork 返回 时 ， 我 们 有 了 如 图 8-2 中 所 示 的 结构 。 

重要 的 一 点 是 ， 父 进程 和 子 进程 共享 同一 个 文件 偏 移 量 。 考 虑 下 述 情况 : 一 个 进程 fork 
了 一 个 子 进程 ， 然 后 等 待 子 进程 终止 。 假 定 ， 作 为 普通 处 理 的 一 部 分 ， 父 进程 和 子 进程 都 向 
标准 输出 进行 写 操作 。 如 果 父 进程 的 标准 输出 已 重 定向 (很 可 能 是 由 shell 实现 的 )， 那 么 子 
进程 写 到 该 标准 输出 时 ， 它 将 更 新 与 父 进程 共享 的 该 文件 的 偏 移 量 。 在 这 个 例子 中 ， 当 父 进 
程 等 待 子 进程 时 ， 子 进程 写 到 标准 输出 ; 而 在 子 进程 终止 后 ， 父 进程 也 写 到 标准 输出 上 ， 并 
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且 知 道 其 输出 会 追加 在 子 进 程 所 写 数据 之 后 。 如 果 父 进程 和 子 进程 不 共享 同一 文件 偏 移 量 ， 
要 实现 这 种 形式 的 交互 就 要 困难 得 多 ， 可 能 需要 父 进程 显 式 地 动作 。 231 


父 进程 表 项 文件 表 v 节点 表 


文件 状态 标志 v 节点 信息 
当前 文件 偏 移 量 
v 节点 指针 








文件 状态 标志 
当前 文件 偏 移 量 
v 节点 指针 










文件 状态 标志 
当前 文件 偏 移 量 


v 节点 指针 




















图 8-2 fork 之 后 父 进程 和 子 进 程 之 间 对 打开 文件 的 共享 

如 果 父 进程 和 子 进程 写 同 一 描述 符 指向 的 文件 ， 但 又 没有 任何 形式 的 同步 (如 使 父 进程 等 待 
子 进程 )， 那 么 它们 的 输出 就 会 相互 混合 (假定 所 用 的 描述 符 是 在 fork 之 前 打开 的 )。 虽 然 这 种 
情况 是 可 能 发 生 的 ( 见 图 8-2)， 但 这 并 不 是 常用 的 操作 模式 。 

在 fork 之 后 处 理 文件 描述 符 有 以 下 两 种 常见 的 情况 。 

(OD 父 进程 等 待 子 进程 完成 。 在 这 种 情况 下 ， 父 进程 无 需 对 其 描述 符 做 任何 处 理 。 当 子 进 程 
终止 后 ， 它 曾 进行 过 读 、 写 操作 的 任 一 共享 描述 符 的 文件 偏 移 量 已 做 了 相应 更 新 。 

(2) 父 进 程 和 子 进程 各 自 执行 不 同 的 程序 段 。 在 这 种 情况 下 ， 在 fork 之 后 ， 父 进程 和 子 进 
程 各 自 关闭 它们 不 需 使 用 的 文件 描述 符 ， 这 样 就 不 会 干扰 对 方 使 用 的 文件 描述 符 。 这 种 方法 是 网 
络 服 务 进 程 经 常 使 用 的 。 [232] 

除了 打开 文件 之 外 ， 父 进程 的 很 多 其 他 属性 也 由 子 进程 继承 ， 包 括 : 

。 实际 用 户 ID 、 实 际 组 ID、 有 效用 户 ID、 有 效 组 ID 

e 附属 组 ID 

。 进程 组 ID 
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会 话 ID 

控制 终端 

设置 用 户 ID 标志 和 设置 组 ID 标志 
当前 工作 目录 

根 目录 

文件 模式 创建 屏蔽 字 

信号 屏蔽 和 安排 

对 任 一 打开 文件 描述 符 的 执行 时 关闭 (close-on-exec) 标志 
环境 

连接 的 共享 存储 段 

存储 映像 

资源 限制 


父 进程 和 子 进 程 之 间 的 区 别 具 体 如 下 。 


fork 的 返回 值 不 同 。 

进程 ID 不 同 。 

这 两 个 进程 的 父 进 程 ID 不 同 : 子 进程 的 父 进程 ID 是 创建 它 的 进程 的 ID， 而 父 进 程 
的 父 进程 ID 则 不 变 。 

子 进程 的 tms_utime、tms_stime、tms_cutime 和 tms_ustime 的 值 设置 为 0〈 这 
些 时 间 将 在 8.17 节 中 介绍 )。 

子 进程 不 继承 父 进程 设置 的 文件 锁 。 

子 进 程 的 未 处 理 闹钟 被 清除 。 

子 进程 的 未 处 理 信号 集 设置 为 空 集 。 


其 中 很 多 特性 至 今 尚 未 讨论 过 ， 我 们 将 在 以 后 几 章 中 对 它们 进行 说 明 。 

使 fork 失败 的 两 个 主要 原因 是 : Ca) 系统 中 已 经 有 了 太 多 的 进程 〈 通 常 意味 着 某 个 方面 出 
了 问题 )，(b) 该 实际 用 户 ID 的 进程 总 数 超过 了 系统 限制 。 回 忆 图 2-11， 其 中 CHILD_MAX 规定 
了 每 个 实际 用 户 ID 在 任 一 时 刻 可 拥有 的 最 大 进程 数 。 

fork 有 以 下 两 种 用 法 。 

(1) 一 个 父 进 程 希望 复制 自己 ， 使 父 进程 和 子 进程 同时 执行 不 同 的 代码 段 。 这 在 网 络 服 


务 进 程 中 是 常见 的 





父 进 程 等 待 客户 端的 服务 请 求 。 当 这 种 请 求 到 达 时 ， 父 进程 调用 fork, 





使 子 进程 处 理 此 请 求 。 父 进程 则 继续 等 待 下 一 个 服务 请 求 。 

(2) 一 个 进程 要 执行 一 个 不 同 的 程序 。 这 对 shell 是 常见 的 情况 。 在 这 种 情况 下 ， 子 进程 从 

233| fork 返回 后 立即 调用 exec (RITKE 8.10 节 说 明 exec). 

某 些 操作 系统 将 第 2 种 用 法 中 的 两 个 操作 〈fork 之 后 执行 exec) 组 合成 一 个 操作 ， 称 为 
spawn. UNIX 系统 将 这 两 个 操作 分 开 , 因为 在 很 多 场合 需要 单独 使 用 fork, 其 后 并 不 跟随 exec. 
另外 ， 将 这 两 个 操作 分 开 ， 使 得 子 进程 在 fork 和 exec 之 间 可 以 更 改 自 己 的 属性 ， 如 IO EE 
向 、 用 户 ID、 信 和 号 安排 等 。 在 第 15 章 中 有 很 多 这 方面 的 例子 。 


Single UNIX Specification 在 高 级 实时 选项 组 中 确实 包括 了 spawn 接口 。 但 是 该 接口 并 不 想 替 
换 fork 和 exec。 它 们 的 目的 是 支持 难于 有 效 实现 fork 的 系统 ,特别 是 对 存储 管理 缺少 硬件 支 
He 系统 。 
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8.4 PAH vfork 


vfork 函数 的 调用 序列 和 返回 值 与 fork 相同 ， 但 两 者 的 语义 不 同 。 


vfork 起 源 于 较 早 的 2.9BSD。 有 些 人 认为 ， 该 函数 是 有 瑕 疯 的 。 但 是 本 书 讨论 的 4 种 平台 
都 支持 它 。 事 实 上 ，BSD 的 开发 者 在 4.4BSD 中 删除 了 该 函数 ， 但 4.4BSD 派生 的 所 有 开放 源码 
BSD 版 本 又 将 其 收回 。 在 SUSv3 中 ，vfork 被 标记 为 弃 用 的 接口 ， 在 SUSv4 中 被 完全 删除 。 我 
们 只 是 由 于 历史 的 原因 还 是 把 它 包 含 进来 。 可 移植 的 应 用 程序 不 应 该 使 用 这 个 函数 。 


vfork 函数 用 于 创建 一 个 新 进程 ,而 该 新 进程 的 目的 是 exec 一 个 新 程序 (如 上 一 节 末 
尾 的 (2) 中 一 样 )。 图 1-7 程序 中 的 shell 基本 部 分 就 是 这 类 程序 的 一 个 例子 。vfork 与 fork 
一 样 都 创建 一 个 子 进程 , 但 是 它 并 不 将 父 进 程 的 地 址 空间 完全 复制 到 子 进程 中 ,因为 子 进 程 
会 立即 调用 exec (或 exit)， 于 是 也 就 不 会 引用 该 地 址 空间 。 不 过 在 子 进程 调用 exec 或 
exit 之 前 ， 它 在 父 进 程 的 空间 中 运行 。 这 种 优化 工作 方式 在 某 些 UNIX 系统 的 实现 中 提高 
了 效率 ,但 如 果子 进程 修改 数据 (除了 用 于 存放 vfork 返回 值 的 变量 )、 进 行 函数 调用 、 或 
者 没有 调用 exec 或 exit 就 返回 都 可 能 会 带 来 未 知 的 结果 。( 就 像 上 一 节 中 提 及 的 ， 实 现 
采用 写 时 复制 技术 以 提高 fork 之 后 跟随 exec 操作 的 效率 , 但 是 不 复制 比 部 分 复制 还 是 要 
快 一 些 动 

vfork 和 fork 之 间 的 另 一 个 区 别 是 : vfork 保证 子 进程 先 运行 ， 在 它 调用 exec Mexit 
之 后 父 进 程 才 可 能 被 调度 运行 ， 当 子 进 程 调用 这 两 个 函数 中 的 任意 一 个 时 ， 父 进程 会 恢复 运行 。 
(如 果 在 调用 这 两 个 函数 之 前 子 进 程 依赖 于 父 进程 的 进一步 动作 ， 则 会 导致 死 锁 。) 

下 实例 
图 8-3 中 的 程序 是 图 8-1 中 的 程序 的 修改 版 ， 其 中 用 vfork 代替 了 fork， 删 除了 对 于 标准 


输出 的 write 调用 。 另 外 ， 我 们 也 不 再 需要 让 父 进程 调用 sleep， 因 为 我 们 可 以 保证 ， 在 子 进 
程 调用 exec 或 exit 之 前 ， 内 核 会 使 父 进程 处 于 休眠 状态 。 


#include "apue.h" 





int globvar = 6; /* external variable in initialized data */ 


int 

main (void) 

{ 
int var; /* automatic variable on the stack */ 
pid t pid; 


var - 88; 
printf("before vfork\n"); /* we don't flush stdio */ 
if ((pid = vfork()) < 0) { 

err sys("vfork error"); 


} else if (pid == 0) { /* Gavia */ 
globvar++; /* modify parent's variables */ 
vart+t+; 


_exit (0); /* child terminates */ 
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/* parent continues here */ 

printf ("pid = $1d, glob = $d, var = %d\n", (long) getpid(), globvar, 
var); 

exit (0); 


8-3 vfork 函数 实例 
运行 该 程序 得 到 : 
$.1a.out 


before vfork 
pid = 29039, glob = 7, var = 89 


子 进程 对 变量 做 增 1 的 操作 ， 结 果 改 变 了 父 进程 中 的 变量 值 。 因 为 子 进 程 在 父 进程 的 地 址 空 
间 中 运行 ， 所 以 这 并 不 令 人 惊讶 。 但 是 其 作用 的 确 与 fork 不 同 。 

注意 ， 在 图 8-3 程序 中 ， 调 用 了 _exit 而 不 是 exit。 正 如 7.3 节 所 述 ，_exit 并 不 执行 标准 IO 
缓冲 区 的 冲洗 操作 。 如 果 调 用 的 是 exit 而 不 是 _exit, 则 该 程序 的 输出 是 不 确定 的 。 它 依赖 于 标准 IO 
库 的 实现 ， 我 们 可 能 会 看 到 输出 没有 发 生变 化 ， 或 者 发 现 没有 出 现 父 进程 的 printf 输出 。 

如 果子 进程 调用 exit， 实 现 冲洗 标准 IO 流 。 如 果 这 是 函数 库 采 取 的 唯一 动作 ， 那 么 我 们 
会 见 到 这 样 操作 的 输出 与 子 进程 调用 _exit 所 产生 的 输出 完全 相同 ， 没 有 任何 区 别 。 如 果 该 实现 
也 关闭 标准 IO 流 ， 那 么 表示 标准 输出 FILE 对 象 的 相关 存储 区 将 被 清 0。 因 为 子 进程 借用 了 父 
进程 的 地 址 空间 ， 所 以 当 父 进程 恢复 运行 并 调用 printf 时 ， 也 就 不 会 产生 任何 输出 ，printf 
返回 -1。 注 意 ， 父 进程 的 STDOUT_FILENO 仍然 有 效 ， 子 进程 得 到 的 是 父 进程 的 文件 描述 符 数组 
的 副本 (参见 图 8-2 )。 

大 多 数 exit 的 现代 实现 不 再 在 流 的 关闭 方面 自 找 麻烦 。 因 为 进程 即将 终止 ， 那 时 内 核 
将 关闭 在 进程 中 已 打开 的 所 有 文件 描述 符 。 在 库 中 关闭 这 些 , 只 是 增加 了 开销 而 不 会 带 来 任 
何 益 处 。 [:] 

McKusick 等 [1996] 的 5.6 节 中 包含 了 fork 和 vfork 实现 方面 的 更 多 信息 。 习 题 8.1 和 习题 

8.2 将 继续 对 vfork 进行 讨论 。 


8.5 PRÉ exit 


如 7.3 节 所 述 ， 进 程 有 5 种 正常 终止 及 3 种 异常 终止 方式 。5 种 正常 终止 方式 具体 如 下 。 

(1) 在 main 函数 内 执行 return 语句 。 如 在 7.3 节 中 所 述 ， 这 等 效 于 调用 exit. 

(2) 调用 exit 函数 。 此 函数 由 ISO C 定义 ， 其 操作 包括 调用 各 终止 处 理 程序 (终止 处 理 程 
序 在 调用 atexit 函数 时 登记 )， 然 后 关闭 所 有 标准 VO 流 等 。 因 为 ISO C 并 不 处 理 文件 描述 符 、 
多 进程 〈 父 进程 和 子 进程 ) 以 及 作业 控制 ， 所 以 这 一 定义 对 UNIX 系统 而 言 是 不 完整 的 。 

(D 调用 exit 或 Exit MM. ISOC 定义 _Exit， 其 目的 是 为 进程 提供 一 种 无 需 运 行 终止 
处 理 程序 或 信号 处 理 程 序 而 终止 的 方法 。 对 标准 VO 流 是 否 进行 冲洗 ， 这 取决 于 实现 。 在 UNIX 
系统 中 ，_Exit Wb exit 是 同 义 的 ， 并 不 冲洗 标准 IO Ji. exit 函数 由 exit 调用 ， 它 处 理 
UNIX 系统 特定 的 细节 。_exit 是 由 POSIX.1 说 明 的 。 

在 大 多 数 UNIX 系统 实现 中 ，exit(3) 是 标准 C 库 中 的 一 个 函数 ,而 _exit(2) 则 是 一 个 
系统 调用 。 
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(4) 进程 的 最 后 一 个 线程 在 其 启动 例 程 中 执行 return 语句 。 但 是 ， 该 线程 的 返回 值 不 用 作 
进程 的 返回 值 。 当 最 后 一 个 线程 从 其 启动 例 程 返回 时 ， 该 进程 以 终止 状态 0 返回 。 

(5) 进程 的 最 后 一 个 线程 调用 pthread_exit 图 数 。 如 同 前 面 一 样 ， 在 这 种 情况 中 ， 进 程 
终止 状态 总 是 0, 这 与 传送 给 pthread_exit 的 参数 无 关 。 在 11.5 节 中 ,我 们 将 对 pthread exit 
做 更 多 说 明 。 

3 种 异常 终止 具体 如 下 。 

(1) 调用 abort。 它 产生 SIGABRT 信号 ， 这 是 下 一 种 异常 终止 的 一 种 特例 。 

(2) 当 进 程 接收 到 某 些 信号 时 。( 第 10 章 将 较 详细 地 说 明 信 和 号 。) 信号 可 由 进程 自身 (如 调用 
abort 函数 )、 其 他 进程 或 内 核 产生 。 例 如 ， 若 进程 引用 地 址 空间 之 外 的 存储 单元 、 或 者 除 以 0， 
内 核 就 会 为 该 进程 产生 相应 的 信号 。 

(3) 最 后 一 个 线程 对 “取消 ”cancellation) 请 求 作 出 响应 。 默 认 情 况 下 ,“ 取 消 ” 以 延迟 方 
HARE: 一 个 线程 要 求 取消 另 一 个 线程 ， 若 干 时 间 之 后 ， 目 标 线程 终止 。 在 11.5 节 和 12.7 节 ， 
我 们 将 详细 讨论 “取消 ”请 求 。 

不 管 进程 如 何 终止 ， 最 后 都 会 执行 内 核 中 的 同一 段 代 码 。 这 段 代码 为 相应 进程 关闭 所 有 打开 
描述 符 ， 释 放 它 所 使 用 的 存储 器 等 。 

对 上 述 任意 一 种 终止 情形 ， 我 们 都 希望 终止 进程 能 够 通知 其 父 进 程 它 是 如 何 终止 的 。 对 于 3 
个 终止 函数 (exit. exit 和 _Exit)， 实 现 这 一 点 的 方法 是 ， 将 其 退出 状态 (exit status) 作为 
参数 传送 给 函数 。 在 异常 终止 情况 ， 内 核 〈 不 是 进程 本 身 ) 产生 一 个 指示 其 异常 终止 原因 的 终止 
状态 (termination status )。 在 任意 一 种 情况 下 ， 该 终止 进程 的 父 进程 都 能 用 wait SX waitpid K 
数 〈 将 在 下 一 节 说 明 ) 取得 其 终止 状态 。 

注意 ， 这 里 使 用 了 “退出 状态 ”( 它 是 传递 给 向 3 个 终止 函数 的 参数 ， 或 main 的 返回 值 ) 
和 “终止 状态 ”两 个 术语 ， 以 表示 有 所 区 别 。 在 最 后 调用 _exit 时 ， 内 核 将 退出 状态 转换 成 终止 
状态 (回忆 图 7-2)。 图 8-4 说 明 父 进程 检查 子 进程 终止 状态 的 不 同方 法 。 如 果子 进程 正常 终止 ， 
则 父 进程 可 以 获得 子 进程 的 退出 状态 。 

在 说 明 fork 函数 时 ， 显 而 易 见 ， 子 进程 是 在 父 进程 调用 fork 后 生成 的 。 上 面 又 说 明了 子 
进程 将 其 终止 状态 返回 给 父 进程 。 但 是 如 果 父 进程 在 子 进程 之 前 终止 ， 又 将 如 何 呢 ? 其 回答 是 : 
对 于 父 进程 已 经 终止 的 所 有 进程 ， 它 们 的 父 进 程 都 改变 为 init 进程 。 我 们 称 这 些 进程 由 init 
进程 收养 。 其 操作 过 程 大 致 是， 在 一 个 进程 终止 时 ， 内 核 逐 个 检查 所 有 活动 进程 ， 以 判断 它 是 否 
是 正 要 终止 进程 的 子 进 程 ， 如 果 是 ， 则 该 进程 的 父 进程 ID 就 更 改 为 1 (init 进程 的 ID )。 这 种 
处 理 方法 保证 了 每 个 进程 有 一 个 父 进程 。 

另 一 个 我 们 关心 的 情况 是 ， 如 果子 进程 在 父 进程 之 前 终止 ， 那 么 父 进程 又 如 何 能 在 做 相 
应 检查 时 得 到 子 进程 的 终止 状态 呢 ? 如 果子 进程 完全 消失 了 ， 父 进程 在 最 终 准备 好 检查 子 进 
程 是 否 终 止 时 是 无 法 获取 它 的 终止 状态 的 。 内 核 为 每 个 终止 子 进程 保存 了 一 定量 的 信息 ， 所 
以 当 终 止 进程 的 父 进程 调用 wait 或 waitpid 时 ， 可 以 得 到 这 些 信 息 。 这 些 信 息 至 少 包括 进 
程 ID、 该 进程 的 终止 状态 以 及 该 进程 使 用 的 CPU 时 间 总 量 。 内 核 可 以 释放 终止 进程 所 使 用 的 
所 有 存储 区 ， 关 闭 其 所 有 打开 文件 。 在 UNIX 术语 中 ， 一 个 已 经 终止 、 但 是 其 父 进程 尚未 对 
其 进行 善后 处 理 〈 获 取 终 止 子 进程 的 有 关 人 信息、 释放 它 仍 占用 的 资源 ) 的 进程 被 称 为 僵 死 进 
程 (zombie)。ps(]) 命 令 将 僵 死 进程 的 状态 打印 为 Z。 如 果 编 写 一 个 长 期 运行 的 程序 , 它 fork 
了 很 多 子 进 程 ， 那 么 除非 父 进 程 等 待 取得 子 进 程 的 终止 状态 ， 不 然 这 些 子 进程 终止 后 就 会 变 
成 僵 死 进程 。 
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某 些 系统 提供 了 一 种 避免 产生 僵 死 进程 的 方法 ， 这 将 在 10.7 中 介绍 。 


最 后 一 个 要 考虑 的 问题 是 : 一 个 由 init 进程 收养 的 进程 终止 时 会 发 生 什 么 ? 它 会 不 会 变 成 
一 个 僵 死 进程 ? 对 此 问题 的 回答 是 “ 否 ”， 因 为 init 被 编写 成 无 论 何 时 只 要 有 一 个 子 进程 终止 ， 
init 就 会 调用 一 个 wait 函数 取得 其 终止 状态 。 这 样 也 就 防止 了 在 系统 中 塞 满 僵 死 进程 。 当 提 
及 “一 个 init 的 子 进程 ”时 ， 这 指 的 可 能 是 init 直接 产生 的 进程 (如 将 在 9.2 节 说 明 的 getty 
进程 )， 也 可 能 是 其 父 进程 已 终止 ， 由 init 收养 的 进程 。 


8.6 BM wait 和 waitpid 


当 一 个 进程 正常 或 异常 终止 时 ， 内 核 就 向 其 父 进 程 发 送 SIGCHLD 信号。 因为 子 进程 终止 是 
个 异步 事件 (这 可 以 在 父 进程 运行 的 任何 时 候 发 生 )， 所 以 这 种 信号 也 是 内 核 向 父 进程 发 的 异步 
通知 。 父 进程 可 以 选择 忽略 该 信号 ， 或 者 提供 一 个 该 信号 发 生 时 即 被 调用 执行 的 函数 〈 信 和 号 处 理 
程序 )。 对 于 这 种 信号 的 系统 默认 动作 是 忽略 它 。 第 10 章 将 说 明 这 些 选项 。 现 在 需要 知道 的 是 调 
用 wait M waitpid 的 进程 可 能 会 发 生 什么 。 

。 如 果 其 所 有 子 进 程 都 还 在 运行 ， 则 阻塞 。 

。 如果 一 个 子 进程 已 终止 , 正 等 待 父 进程 获取 其 终止 状态 , 则 取得 该 子 进 程 的 终止 状态 立即 返回 。 

。 如 果 它 没有 任何 子 进程 ， 则 立即 出 错 返回 。 

如 果 进 程 由 于 接收 到 SIGCHLD 信号 而 调用 wait， 我 们 期 望 wait 会 立即 返回 。 但 是 如 果 在 
随机 时 间 点 调用 wait， 则 进程 可 能 会 阻塞 。 


#include <sys/wait.h> 


pid t wait(int *statloc) ; 


pid_t waitpid(pid_t pid, int *statloc, int options) ; 
两 个 函数 返回 值 : 若 成 功 ， 返 回 进程 ID， 若 出 错 ， 返 回 0〈 见 后 面 的 说 明 ) 或 -1 





这 两 个 函数 的 区 别 如 下 。 

。 在 一 个 子 进程 终止 前 , wait 使 其 调用 者 阻塞 , 而 waitpid 有 一 选项 , 可 使 调用 者 不 阻塞 。 

。 waitpid 并 不 等 待 在 其 调用 之 后 的 第 一 个 终止 子 进程 ， 它 有 若干 个 选项 ， 可 以 控制 它 所 

如 果子 进程 已 经 终止 ， 并 且 是 一 个 僵 死 进程 ， 则 wait 立即 返回 并 取得 该 子 进程 的 状态 ， 否 
WW wait 使 其 调用 者 阻塞 ， 直 到 一 个 子 进程 终止 。 如 调用 者 阻塞 而 且 它 有 多 个 子 进 程 ， 则 在 其 某 
一 子 进程 终止 时 ，wait 就 立即 返回 。 因 为 wait 返回 终止 子 进程 的 进程 ID， 所 以 它 总 能 了 解 是 

238] 哪 一 个 子 进 程 终 止 了 。 

这 两 个 函数 的 参数 statloc 是 一 个 整 型 指针 。 如 果 statloc 不 是 一 个 空 指针 ， 则 终止 进程 的 终止 
状态 就 存放 在 它 所 指向 的 单元 内 。 如 果 不 关心 终止 状态 ， 则 可 将 该 参数 指定 为 空 指针 。 . 

依据 传统 ， 这 两 个 函数 返回 的 整 型 状态 字 是 由 实现 定义 的 。 其 中 某 些 位 表示 退出 状态 (正常 
返回 )， 其 他 位 则 指示 信和 号 编号 (异常 返回 )， 有 一 位 指示 是 否 产生 了 core 文件 等 。 POSIX.1 规定 ， 
终止 状态 用 定义 在 <sys/wait .h> 中 的 各 个 宏 来 查看 。 有 4 个 互 斥 的 宏 可 用 来 取得 进程 终止 的 原 
Al, 它们 的 名 字 都 以 WIF 开始 。 基于 这 4 个 宏 中 哪 一 个 值 为 真 , 就 可 选用 其 他 宏 来 取得 退出 状态 、 
信和 号 编号 等 。 这 4 个 互 斥 的 宏 示 于 图 8-4 rh. 
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WIFEXITED (status) 若 为 正常 终止 子 进程 返回 的 状态 ， 则 为 真 。 对 于 这 种 情况 可 执行 
WEXITSTATUS(status)， 获 取 子 进程 传送 给 exit 或 exit 参数 的 低 8 位 


WIFSIGNALED (status) 若 为 异常 终止 子 进程 返回 的 状态 ， 则 为 真 〈 接 到 一 个 不 捕捉 的 信号 )。 对 于 这 
种 情况 ， 可 执行 WTERMSIG(stafxs)， 获 取 使 子 进程 终止 的 信号 编号 。 另 外 ， 有 


些 实现 〈 非 Single UNIX Specification) 定义 宏 WCOREDUMP(status)， 若 已 产生 
终止 进程 的 core 文件 ， 则 它 返 回 真 


若 为 当前 暂停 子 进程 的 返回 的 状态 ， 则 为 真 。 对 于 这 种 情况 ， 可 执行 
WSTOPSIG(status)， 获 取 使 子 进程 暂停 的 信号 编号 
WIFCONTINUED (status) 若 在 作业 控制 暂停 后 已 经 继续 的 子 进程 返回 了 状态 ， 则 为 真 (POSIX.1 的 XSI 





图 8-4 检查 wait 和 waitpid 所 返回 的 终止 状态 的 宏 
在 9.8 节 中 讨论 作业 控制 时 ， 将 说 明 如 何 停 止 一 个 进程 。 


m Scl 


图 8-5 中 的 函数 pr_exit 使 用 图 8-4 中 的 宏 以 打印 进程 终止 状态 的 说 明 。 本 书 中 的 很 多 程序 
都 将 调用 此 函数 。 注 意 ， 如 果 定 义 了 WCOREDUMP 宏 ， 则 此 函数 也 处 理 该 宏 。 


#include "apue.h" 
#include <sys/wait.h> 


void 
pr_exit(int status) 
{ 
if (WIFEXITED (status) ) 
printf ("normal termination, exit status = %d\n", 
WEXITSTATUS (status) ); 
else if (WIFSIGNALED (status) ) 
printf("abnormal termination, signal number = %d%s\n", 
WTERMSIG(status), 
#ifdef WCOREDUMP 
WCOREDUMP (status) ? " (core file generated)" : ""); 
else 
Bee 
#endif 
else if (WIFSTOPPED(status) ) 
printf ("child stopped, signal number = %d\n", 
WSTOPSIG (status) ); 


图 8-5 打印 exit 状态 的 说 明 


FreeBSD 8.0、Linux 3.2.0, Mac OS X 10.6.8 以 及 Solaris 10 都 支持 WCOREDUMP 宏 。 但 是 如 果 
定义 了 _POSIX_C_SOURCE 常量 ， 有 些 平台 就 隐藏 这 个 定义 (回忆 2.7 节 )。 
图 8-6 中 程序 调用 pr exit 函数 ， 演 示 终 止 状 态 的 各 种 值 。 





#include "apue.h" 
#include <sys/wait.h> 


int 
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main(void) 

{ 
pid_t pid; 
int status; 


if ((pid = fork()) < 0) 
err_sys ("fork error"); 


else if (pid == 0) /* child */ 
exit (7); 
if (wait(&status) !- pid) /* wait for child */ 


err sys("wait error"); 
pr exit(status); /* and print its status */ 


if ((pid = fork()) « 0) 
err sys("fork error"); 


else if (pid -- 0) /* child */ 
abort(); /* generates SIGABRT */ 
if (wait(&status) !- pid) /* wait for child */ 


err sys("wait error"); 
pr exit(status); /* and print its status */ 


if ((pid = fork()) < 0) 
err sys("fork error"); 


else if (pid == 0) /® child */ 

status /- 0; /* divide by 0 generates SIGFPE */ 
if (wait(&status) != pid) /* wait for child */ 

err sys("wait error"); 
pr exit(status); /* and print its status */ 
exit(0); 


图 8-6 ”演示 不 同 的 exit fü 
运行 该 程序 可 得 : 
$ ./a.out 
normal termination, exit status - 7 


abnormal termination, signal number - 6 (core file generated) 
abnormal termination, signal number - 8 (core file generated) 


现在 ， 我 们 可 以 从 WTERMSIG 中 打印 信号 编号 。 可 以 查看 <signal .h> 头 文件 验证 SIGABRT 的 
{i 6, SIGFPE 的 值 为 8。 我 们 将 在 10.22 节 中 看 到 一 种 可 移植 的 方式 进行 信号 编号 到 说 明 性 名 
字 的 映射 。 m 
正如 前 面 所 述 ， 如 果 一 个 进程 有 几 个 子 进 程 ， 那 么 只 要 有 一 个 子 进程 终止 ，wait 就 返回 。 
如 果 要 等 竺 一 个 指定 的 进程 终止 (如 果 知 道 要 等 待 进程 的 ID ), 那么 该 如 何 做 呢 ? 在 早期 的 UNIX 
版 本 中 ， 必 须 调 用 wait， 然 后 将 其 返回 的 进程 ID 和 所 期 望 的 进程 ID 相 比较 。 如 果 终 止 进程 不 
是 所 期 望 的 ， 则 将 该 进程 ID 和 终止 状态 保存 起 来 ， 然 后 再 次 调用 wait。 反 复 这 样 做 ， 直 到 所 期 
望 的 进程 终止 。 下 一 次 又 想 等 待 一 个 特定 进程 时 ， 先 查看 已 终止 的 进程 列表 ， 若 其 中 已 有 要 等 待 
的 进程 ， 则 获取 相关 信息 ; 否则 调用 wait. 其实, 我 们 需要 的 是 等 待 一 个 特定 进程 的 函数 。 POSIX. 
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定义 了 waitpid 函数 以 提供 这 种 功能 (以 及 其 他 一 些 功能 )。 
对 于 waitpid 函数 中 pid 参数 的 作用 解释 如 下 。 


pid ==-| 等 待 任 一 子 进程 。 此 种 情况 下 ，waitpid 4 wait 等 效 。 
pid>0 等 待 进程 ID 与 pid 相等 的 子 进程 。 
pid —0 等 待 组 ID 等 于 调用 进程 组 ID 的 任 一 子 进程 。(9.4 节 将 说 明 进 程 组 。) 240 


pid<-1 等 待 组 ID 等 于 pid 绝对 值 的 任 一 子 进程 。 l 

waitpid 函数 返回 终止 子 进程 的 进程 ID， 并 将 该 子 进程 的 终止 状态 存放 在 由 statloc 指向 的 (241 
存储 单元 中 。 对 于 wait， 其 唯一 的 出 错 是 调用 进程 没有 子 进程 (函数 调用 被 一 个 信号 中 断 时 ， 
也 可 能 返回 另 一 种 出 错 。 第 10 章 将 对 此 进行 讨论 )。 但 是 对 于 waitpid， 如 果 指 定 的 进程 或 进程 
组 不 存在 ， 或 者 参数 pid 指定 的 进程 不 是 调用 进程 的 子 进程 ， 都 可 能 出 错 。 

options 参数 使 我 们 能 进一步 控制 waitpid 的 操作 。 此 参数 或 者 是 0， 或 者 是 图 8-7 中 常量 
按 位 或 运算 的 结果 。 

FreeBSD 8.0 和 Solaris 10 支持 另 一 个 非 标 准 的 可 选 常量 WNOWAIT, 它 使 系统 将 终止 状态 已 由 
waitpid 返回 的 进程 保持 在 等 待 状态 ， 这样 它 可 被 再 次 等 待 。 


WCONTINUED 若 实现 支持 作业 控制 ， 那 么 由 pid 指定 的 任 一 子 进程 在 停止 后 已 经 继续 ， 但 其 状态 尚 
未 报告 ， 则 返回 其 状态 (POSIX.1 的 XSI 扩展 ) 


Hh pid 指定 的 子 进程 并 不 是 立即 可 用 的 ， 则 waitpid 不 阻塞 ， 此 时 其 返回 值 为 0 

WUNTRACED 车 某 实现 支持 作业 控制 ， 而 由 pid 指定 的 任 一 子 进程 已 处 于 停止 状态 ， 并 且 其 状态 自 
停止 以 来 还 未 报告 过 ， 则 返回 其 状态 。WIFSTOPPED 宏 确定 返回 值 是 否 对 应 于 一 个 停止 
的 子 进程 





8-7 waitpid 的 options 常量 
waitpid 函数 提供 了 wait 函数 没有 提供 的 3 个 功能 。 
(Dwaitpid 可 等 待 一 个 特定 的 进程 , 而 wait 则 返回 任 一 终止 子 进程 的 状态 ,在 讨论 popen 
函数 时 会 再 说 明 这 一 功能 。 
(2) waitpid 提供 了 一 个 wait 的 非 阻 塞 版 本 。 有 时 希望 获取 一 个 子 进程 的 状态 ， 但 不 
想 阻塞 。 
(3) waitpid 通过 WUNTRACED 和 WCONTINUED 选项 支持 作业 控制 。 


器 实例 
回忆 8.5 节 中 有 关 僵 死 进程 的 讨论 。 如 果 一 个 进程 fork 一 个 子 进程 ， 但 不 要 它 等 待 子 进程 

终止 ， 也 不 希望 子 进程 处 于 僵 死 状态 直到 父 进程 终止 ， 实 现 这 一 要 求 的 诀窍 是 调用 fork 两 次 。 

图 8-8 程序 实现 了 这 一 点 。 242 
#include "apue.h" 

#include <sys/wait.h> 

int 
main (void) 


{ 
pid t pid; 
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if ((pid = fork()) < 0) { 
err _sys ("fork error"); 
} else if (pid == 0) { /* first child */ 
if ((pid = fork()) < 0) 
err sys("fork error"); 
else if (pid > 0) 
exit(0); /* parent from second fork -- first child */ 


* We're the second child; our parent becomes init as soon 
* as our real parent calls exit() in the statement above. 
* Here's where we'd continue executing, knowing that when 
* we're done, init will reap our status. 


+y 
sleep (2); 
printf ("second child, parent pid = %ld\n", (long)getppid()); 
exit (0); 
} 
if (waitpid(pid, NULL, 0) != pid) /* wait for first child */ 


err_sys("waitpid error"); 


/* 

* We're the parent (the original process); we continue executing, 
* knowing that we're not the parent of the second child. 

*/ 

exit(0); 


图 8-8 fork 两 次 以 避免 僵 死 进程 
第 二 个 子 进程 调用 sleep 以 保证 在 打印 父 进程 ID 时 第 一 个 子 进程 已 终止 。 在 fork 之 后 ， 
父 进程 和 子 进 程 都 可 继续 执行 ， 并 且 我 们 无 法 预知 哪 一 个 会 先 执行 。 在 fork 之 后 ， 如 果 不 使 第 
二 个 子 进 程 休 眼 ， 那 么 它 可 能 比 其 父 进 程 先 执行 ， 于 是 它 打印 的 父 进程 ID 将 是 创建 它 的 父 进 程 ， 
而 不 是 init 进程 (进程 ID 1). 
执行 图 8-8 程序 得 到 : 


$ ./a.out 
$ second child, parent pid - 1 


注意 ， 当 原先 的 进程 (也 就 是 exec 本 程序 的 进程 ) 终止 时 ，shell 打印 其 提示 符 ， 这 在 第 二 个 子 
243) 进程 打印 其 父 进程 ID 之 前 。 * 


8.7 AM waitid 


Single UNIX Specification 包括 了 男 一 个 取得 进程 终止 状态 的 函数 一 一 waitid， 此 函数 类 似 
于 waitpid， 但 提供 了 更 多 的 灵活 性 。 





#include <sys/wait.h> 


int waitid(idtype t idtype, id t id, siginfo t *infop, int options); 


返回 值 ， 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 
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与 waitpid 相似 ，waitid 允许 一 个 进程 指定 要 等 待 的 子 进程 。 但 它 使 用 两 个 单独 的 参数 
表示 要 等 待 的 子 进程 所 属 的 类 型 ， 而 不 是 将 此 与 进程 ID 或 进程 组 ID 组 合成 一 个 参数 。id 参数 的 
作用 与 idtype 的 值 相关 。 该 函数 支持 的 idtype 类 型 列 在 图 8-9 中 。 


: id 包含 要 等 待 子 进程 的 进程 ID 


等 待 一 特定 进程 组 中 的 任 一 子 进程 ，id 包含 要 等 待 子 进程 的 进程 组 ID 
等 待 任 一 子 进程 ， 忽 略 id 
图 8-9 waitid 的 idtype 常量 
options 参数 是 图 8-10 中 各 标志 的 按 位 或 运算 。 这 些 标志 指示 调用 者 关注 哪些 状态 变化 。 





说 明 


等 待 一 进程 ， 它 以 前 曾 被 停止 ， 此 后 又 已 继续 ， 但 其 状态 尚未 报告 
等 竺 已 退 出 的 进程 


如 无 可 用 的 子 进程 退出 状态 ， 立 即 返回 而 非 阻塞 
WNOWAIT 不 破坏 子 进程 退出 状态 。 该 子 进程 退出 状态 可 由 后 续 的 wait、waitid 或 waitpid 
调用 取得 


等 待 一 进程 ， 它 已 经 停止 ， 但 其 状态 尚未 报告 





图 8-10 waitid 的 options 常量 
WCONTINUED, WEXITED 或 WSTOPPED 这 3 个 常量 之 一 必须 在 options 参数 中 指定 。 
infop 参数 是 指向 siginfo 结构 的 指针 。 该 结构 包含 了 造成 子 进程 状态 改变 有 关 信 号 的 详细 
信息 。10.14 节 将 进一步 讨论 siginfo 结构 。 
本 书 讨论 的 4 种 平台 中 ,Linux 3.2.0, Mac OS X 10.6.8 和 Solaris 10 支持 waitid, 但 要 注意 


的 是 ，Mac OS X 10.6.8 并 没有 设置 siginfo 结构 中 的 所 有 信息 。 


8.8 PAM wait3 和 wait4 


大 多 数 UNIX 系 统 实现 提供 了 另外 两 个 函数 wait3 和 wait4。 历 史上 ,这 两 个 函数 是 从 UNIX 
系统 的 BSD 分 支 延 袭 下 来 的 。 它 们 提供 的 功能 比 POSIX.1 函数 wait. waitpid 和 waitid 所 
提供 功能 的 要 多 一 个 ， 这 与 附加 参数 有 关 。 该 参数 允许 内 核 返 回 由 终止 进程 及 其 所 有 子 进程 使 用 
的 资源 概况 。 

#include <sys/types.h> 
#include <sys/wait.h> 


#include <sys/time.h> 
#include <sys/resource.h> 


pid t wait3(int *statloc, int options, struct rusage *rusage); 


pid t wait4(pid t pid, int *statloc, int options, struct rusage *rusage); 
两 个 函数 返回 值 : 若 成 功 ， 返 回 进程 ID; 若 出 错 ， 返 回 -1 
资源 统计 信息 包括 用 户 CPU 时 间 总 量 、 系 统 CPU 时 间 总 量 、 缺 页 次 数 、 接 收 到 信号 的 次 数 
等 。 有 关 细 节 请 参阅 getrusage(2) 手 册页 (这 种 资源 信息 与 7.11 节 中 所 述 的 资源 限制 不 同 )。 
图 8-11 列 出 了 各 个 wait 函数 所 支持 的 参数 。 
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wait 
waitid 
waitpid 

wait3 
bP 
图 8-11 不 同系 统 上 各 个 wait 函数 所 支持 的 参数 


Single UNIX Specification 的 早期 版 本 包括 wait3 函数 。 在 SUSv2 中 ，wait3 被 移 到 了 遗留 
| 目录 下 ， 在 SUSv3 中 ， 则 删 去 了 wait3。 


8.9 ”竞争 条 件 


当 多 个 进程 都 企图 对 共享 数据 进行 某 种 处 理 ， 而 最 后 的 结果 又 取决 于 进程 运行 的 顺序 时 ， 我 
们 认为 发 生 了 竞争 条 件 (race condition)。 如 果 在 fork 之 后 的 某 种 逻辑 显 式 或 隐 式 地 依赖 于 在 
fork 之 后 是 父 进程 先 运行 还 是 子 进 程 先 运行 ， 那 么 fork 函数 就 会 是 竞争 条 件 活跃 的 滋生 地 。 
通常 ， 我 们 不 能 预料 哪 一 个 进程 先 运行 。 即 使 我 们 知道 哪 一 个 进程 先 运行 ， 在 该 进程 开始 运行 后 

所 发 生 的 事情 也 依赖 于 系统 负载 以 及 内 核 的 调度 算法 。 

在 图 8-8 程序 中 ， 当 第 二 个 子 进程 打印 其 父 进程 ID 时 ， 我 们 看 到 了 一 个 潜在 的 竞争 条 件 。 如 果 第 
二 个 子 进程 在 第 一 个 子 进程 之 前 运行 ， 则 其 父 进程 将 会 是 第 一 个 子 进程 。 但 是 ， 如 果 第 一 个 子 进程 先 运 
行 ,并 有 足够 的 时 间 到 达 并 执行 exit, 则 第 二 个 子 进程 的 父 进程 就 是 init。 即 使 在 程序 中 调用 sleep, 
也 不 能 保证 什么 。 如 果 系 统 负载 很 重 ， 那 么 在 sleep 返回 之 后 、 第 一 个 子 进程 得 到 机 会 运行 之 前 ， 第 
二 个 子 进程 可 能 恢复 运行 。 这 种 形式 的 问题 很 难 调试 ， 因 为 在 大 部 分 时 间 ， 这 种 问题 并 不 出 现 。 

如 果 一 个 进程 希望 等 待 一 个 子 进程 终止 ， 则 它 必 须 调用 wait 函数 中 的 一 个 。 如 果 一 个 进程 
要 等 待 其 父 进程 终止 (如 图 8-8 程序 中 一 样 )， 则 可 使 用 下 列 形式 的 循环 : 


while(getppid() != 1) 
sleep(1); 


这 种 形式 的 循环 称 为 轮 询 (polling)， 它 的 问题 是 浪费 了 CPU 时间， 因为 调用 者 每 阳 1 s 都 被 
唤醒 ， 然 后 进行 条 件 测试 

为 了 避免 竞争 条 件 和 轮 询 ， 在 多 个 进程 之 间 需 要 有 某 种 形式 的 信号 发 送 和 接收 的 方法 。 在 
UNIX 中 可 以 使 用 信号 机 制 ， 在 10.16 节 将 说 明 它 在 解决 此 方面 问题 的 一 种 用 法 。 各 种 形式 的 进 
程 间 通信 (IPC) 也 可 使 用 ， 在 第 15 章 和 第 17 章 将 对 此 进行 讨论 。 

在 父 进程 和 子 进程 的 关系 中 ， 常 常 出 现下 述 情况 。 在 fork 之 后 ， 父 进程 和 子 进程 都 有 一 些 
事情 要 做 。 例 如 ， 父 进程 可 能 要 用 子 进程 ID 更 新 日 志文 件 中 的 一 个 记录 ， 而 子 进程 则 可 能 要 为 
父 进程 创建 一 个 文件 。 在 本 例 中 ， 要 求 每 个 进程 在 执行 完 它 的 一 套 初 始 化 操作 后 要 通知 对 方 ， 并 
且 在 继续 运行 之 前 ， 要 等 待 另 一 方 完 成 其 初始 化 操作 。 这 种 情况 可 以 用 代码 描述 如 下 : 


#include "apue.h" 
TELL_WAIT () ; /* set things up for TELL_xxx & WAIT_xxx*/ 
if ((pid = fork()) < 0) { 
err_sys("fork error"); 
) else if (pid == 0) { /* child*/ 
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/* child does whatever is necessary ...*/ 
TELL_PARENT (getppid()); /* tell parent we're done*/ 
WAIT PARENT(); /* and wait for parent*/ 
/* and the child continues on its way ...*/ 
exit(0); 
} 
/* parent does whatever is necessary ...*/ 
TELL_CHILD (pid) ; /* tell child we're done*/ 
WAIT CHILD(); /* and wait for child*/ 
/* and the parent continues on its way ...*/ 
exit(0); 


假定 在 头 文件 apue.h 中 定义 了 需要 使 用 的 各 个 变量 。5 个 例 程 TELLWAIT. TELL PARENT. 
TELL CHILD. WAIT PARENT LAR WAIT CHILD 可 以 是 宏 ， 也 可 以 是 函数 。 

在 后 面 儿 章 中 会 说 明 实 现 这 些 TELL Al WALT 例 程 的 不 同方 法 : 10.16 节 中 说 明 使 用 信号 的 一 
种 实现 ， 图 15-7 程序 说 明 使 用 管道 的 一 种 实现 。 下 面 先 看 一 个 使 用 这 5 个 例 程 的 实例 。 


PEs 


图 8-12 程序 输出 两 个 字符 串 : 一 个 由 子 进 程 输出 ， 另 一 个 由 父 进程 输出 。 因 为 输出 依赖 于 内 
核 使 这 两 个 进程 运行 的 顺序 及 每 个 进程 运行 的 时 间 长 度 ， 所 以 该 程序 包含 了 一 个 竞争 条 件 。 


#include "apue.h" 
static void charatatime(char *); 


int 
main (void) 
{ 
pid_t pid; 


if ((pid = fork()) < 0) { 
err_sys ("fork error"); 
} else if (pid == 0) { 
charatatime ("output from child\n"); 
) else ( 
charatatime ("output from parent\n"); 
} 
exit (0); 
} 


static void 
charatatime(char *str) 
{ 


char *ptr; 


int ef 
setbuf (stdout, NULL); /* set unbuffered */ 
for (ptr = str; (c = *ptr++) != 0; ) 


putc(c, stdout); 


图 8-12 带 有 竞争 条 件 的 程序 
在 程序 中 将 标准 输出 设置 为 不 带 缓冲 的 ， 于 是 每 个 字符 输出 都 需 调用 一 次 write。 本 例 的 目 
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的 是 使 内 核能 尽 可 能 多 次 地 在 两 个 进程 之 间 进 行 切换 ， 以 便 演示 竞争 条 件 。( 如 果 不 这 样 做 ， 可 


能 也 就 决 不 会 见 到 下 面 所 示 的 输出 。 没 有 看 到 具有 错误 的 输出 并 不 意味 着 竞争 条 件 不 存在 ， 这 只 


$ ./a.out 

ooutput from child 
utput from parent 

$ ./a.out 

ooutput from child 
utput from parent 

$ ./a.out 

output from child 

output from parent 


修改 图 8-12 中 的 程序 ， 使 其 使 用 TELL 和 WAIT 函数 ， 于 是 形成 了 图 8-13 中 的 程序 
标 以 + 号 的 行 是 新 增加 的 行 。 


#include "apue.h" 
static void charatatime(char *); 


int 
main (void) 
{ 
pid_t pid; 


TELL_WAIT (); 
if ((pid = fork()) < 0) { 


err_sys("fork error"); 
} else if (pid == 0) { 


WAIT PARENT(); /* parent goes first*/ 
charatatime("output from child\n"); 
) else ( 


charatatime("output from parent Mn"); 
TELL CHILD (pid); 
} 
exit (0); 
} 


static void 
charatatime(char *str) 
f 

char *ptr: 

int ez 


setbuf (stdout, NULL); /* set unbuffered*/ 
for (ptr = str; (c = *ptr++) != 0; ) 
putc(c, stdout); 








8-13 ”修改 图 8-12 程序 以 避免 竞争 条 件 
运行 此 程序 则 能 得 到 所 预期 的 输出 一 一 两 个 进程 的 输出 不 再 交叉 混合 。 
图 8-13 中 的 程序 是 使 父 进程 先 运 行 。 如 果 将 fork 之 后 的 行 改 成 : 


4 


是 意味 着 在 此 特定 的 系统 上 未 能 见 到 它 。) 下 面 的 实际 输出 说 明 该 程序 的 运行 结果 是 会 改变 的 。 


T 


H 
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else if (pid == 0) { 
charatatime ("output from child\n"); 
TELL PARENT (getppid()); 
) else ( 
WAIT CHILD(); /* child goes first */ 
charatatime ("output from parent Mn"); 


) 


则 子 进程 先 运 行 。 习 题 8.4 将 继续 这 一 实例 。 m 
8.10 PAH exec 


8.3 节 曾 提 及 用 fork 函数 创建 新 的 子 进程 后 , 子 进程 往往 要 调用 一 种 exec 函数 以 执行 男 一 
个 程序 。 当 进程 调用 一 种 exec 函数 时 ， 该 进程 执行 的 程序 完全 替换 为 新 程序 ， 而 新 程序 则 从 其 
main 函数 开始 执行 。 因 为 调用 exec 并 不 创建 新 进程 ， 所 以 前 后 的 进程 ID 并 未 改变 。exec 只 
是 用 磁盘 上 的 一 个 新 程序 替换 了 当前 进程 的 正文 段 、 数 据 段 、 堆 段 和 栈 段 。 
有 7 种 不 同 的 exec 函数 可 供 使 用 , 它们 常常 被 统称 为 exec 函数 , 我 们 可 以 使 用 这 7 个 函数 中 的 
任 一 个 。 这 些 exec 函数 使 得 UNIX 系统 进程 控制 原 语 更 加 完善 。 用 fork 可 以 创建 新 进程 ， 用 exec 
可 以 初始 执行 新 的 程序 。exit 函数 和 wait 函数 处 理 终止 和 等 待 终止 。 这 些 是 我 们 需要 的 基本 的 进程 
控制 原 语 。 在 后 面 各 节 中 将 使 用 这 些 原 语 构 造 男 外 一 些 如 popen 和 system 之 类 的 函数 。 
#include <unistd.h> 
execl (const char *pathname, const char *arg0, ... /* (char *)0 */ ); 
execv(const char *pathname, char *const argv[]); 


execle(const char *pathname, const char *arg0, ... 
/* (char *)0, char *const envyp[] */ ): 


execve(const char *pathname, char *const argv[], char *const envp[]); 


execlp (const char *filename, const char *arg0, ... /* (char *)0 */ ); 


execvp(const char *filename, char *const argv[]):; 


fexecve(int fd, char *const argv[], char *const envp[]); 


7 个 函数 返回 值 : 若 出 错 ， 返 回 -1， 若 成 功 ， 不 返回 

这 些 函 数 之 间 的 第 一 个 区 别 是 前 4 个 函数 取 路 径 名 作为 参数 ， 后 两 个 函数 则 取 文 件 名 作为 参 
数 ， 最 后 一 个 取 文 件 描 述 符 作为 参数 。 当 指定 filename 作为 参数 时 : 

。 WẸ filename 中 包含 /， 则 就 将 其 视 为 路 径 名 ; 

。 ATURE PATH 环境 变量 ， 在 它 所 指定 的 各 目录 中 搜寻 可 执行 文件 。 

PATH 变量 包含 了 一 张 目 录 表 ( 称 为 路 径 前 级 )， 目 录 之 间 用 冒号 〈(:) 分 隔 。 例 如 ， 下 列 
name=value 环境 字符 串 指定 在 4 个 目录 中 进行 搜索 。 

PATH-/bin:/usr/bin:/usr/local/bin:. 

最 后 的 路 径 前 级 .表示 当前 目录 。( 零 长 前 缀 也 表示 当前 目录 。 在 value 的 开始 处 可 用 :表示 ， 
在 行 中 间 则 要 用 : : 表示， 在 行 尾 以 :表示 。) 

出 于 安全 性 方面 的 考虑 , 有 些 人 要 求 在 搜索 路 径 中 决 不 要 包括 当前 目录 。 请 参见 Garfinkel 等 [2003]。 
如 果 execlp 或 execvp 使 用 路 径 前 绥 中 的 一 个 找到 了 一 个 可 执行 文件 , 但 是 该 文件 不 是 由 
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连接 编辑 器 产生 的 机 器 可 执行 文件 ， 则 就 认为 该 文件 是 一 个 shell 脚本 ， 于 是 试 着 调用 /bin/sh， 
JE WX filename 作为 shell 的 输入 。 

fexecve 函数 避免 了 寻找 正确 的 可 执行 文件 ， 而 是 依赖 调用 进程 来 完成 这 项 工作 。 调 用 进程 
可 以 使 用 文件 描述 符 验 证 所 需要 的 文件 并 且 无 竞争 地 执行 该 文件 。 否则， 拥有 特权 的 恶意 用 户 就 
可 以 在 找到 文件 位 置 并 且 验 证 之 后 ， 但 在 调用 进程 执行 该 文件 之 前 替换 可 执行 文件 (或 可 执行 文 
件 的 部 分 路 径 )， 具 体 可 参考 3.3 节 TOCTTOU 的 讨论 。 

第 二 个 区 别 与 参数 表 的 传递 有 关 (1 表示 列表 list, v RAKE vector). MM execl. execlp 
和 execle 要 求 将 新 程序 的 每 个 命令 行 参 数 都 说 明 为 一 个 单独 的 参数 ,这 种 参数 表 以 空 指针 结尾 。 
对 于 另外 4 个 函数 (execv、execvp、execve 和 fexecve)， 则 应 先 构 造 一 个 指向 各 参数 的 指 
针 数 组 ， 然 后 将 该 数组 地 址 作为 这 4 个 函数 的 参数 。 

在 使 用 ISO C 原型 之 前 , 对 execl. execle 和 execlp 三 个 函数 表示 命令 行 参数 的 一 般 方法 是 ; 


char *argÜ, char *argl, ..., char *argn, (char *)0 


这 种 语法 显 式 地 说 明了 最 后 一 个 命令 行 参数 之 后 跟 了 一 个 空 指针 。 如 果 用 常量 0 来 表示 一 个 空 指 
针 ， 则 必须 将 它 强制 转换 为 一 个 指针 ;否则 它 将 被 解释 为 整 型 参数 。 如 果 一 个 整 型 数 的 长 度 与 
char * 的 长 度 不 同 ， 那 么 exec 函数 的 实际 参数 将 出 错 。 

最 后 一 个 区 别 与 向 新 程序 传递 环境 表 相 关 。 以 e 结尾 的 3 个 函数 (execle、execve 和 fexecve) 
可 以 传递 一 个 指向 环境 字符 串 指 针 数 组 的 指针 。 其 他 4 个 函数 则 使 用 调用 进程 中 的 environ 变量 为 新 
程序 复制 现 有 的 环境 (回忆 7.9 节 及 图 7-8 中 对 环境 字符 串 的 讨论 。 其 中 曾 提 及 如 果 系 统 支 持 setenv 
All putenv 这 样 的 函数 ， 则 可 更 改 当 前 环境 和 后 面 生成 的 子 进程 的 环境 , 但 不 能 影响 父 进程 的 环境 )。 
通常 ， 一 个 进程 允许 将 其 环境 传播 给 其 子 进程 ， 但 有 时 也 有 这 种 情况 ， 进 程 想 要 为 子 进程 指定 某 一 个 
确定 的 环境 。 例如， 在 初始 化 一 个 新 登录 的 shell Ff, login 程序 通常 创建 一 个 只 定义 少数 几 个 变量 
的 特殊 环境 ， 而 在 我 们 登录 时 ， 可 以 通过 shell 启动 文件 ， 将 其 他 变量 加 到 环境 中 。 

在 使 用 ISO C 原型 之 前 ，execle 的 参数 是 : 

char *pathname, char *argÜ, ..., char *argn, (char *)0, char *envp[] 
从 中 可 见 , 最 后 一 个 参数 是 指向 环境 字符 串 的 各 字符 指针 构成 的 数组 的 指针 。 而 在 ISO C 原型 中 ， 
所 有 命令 行 参 数 、 空 指针 和 envp 指针 都 用 省 略 号 〈. . . ) Xem. 

这 7 个 exec 函数 的 参数 很 难 记忆 。 函 数 名 中 的 字符 会 给 我 们 一 些 帮 助 。 字 和 母 p 表示 该 函数 
WX filename 作为 参数 , 并 且 用 PATH 环境 变量 寻找 可 执行 文件 。 字母 1 表示 该 函数 取 一 个 参数 表 ， 
它 与 字母 v HJF. v 表示 该 函数 取 一 个 argv[ AE. 最后， 字母 e 表示 该 函数 取 envp[ ] 数 组 ， 而 
不 使 用 当前 环境 。 图 8-14 显示 了 这 7 个 函数 之 间 的 区 别 。 


| 


execlp 


execle 
execv 

execvp 
execve 


fexecve 





图 8-14 7 个 exec 函数 之 间 的 区 别 
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每 个 系统 对 参数 表 和 环境 表 的 总 长 度 都 有 一 个 限制 。 在 2.5.2 节 和 图 2-8 中 ， 这 种 限制 是 由 
ARG MAX 给 出 的 。 在 POSIX.1 系统 中 ， 此 值 至 少 是 4096 字 节 。 当 使 用 shell 的 文件 名 扩充 功能 
产生 一 个 文件 名 列表 时 ， 可 能 会 受到 此 值 的 限制 。 例 如 ， 命 令 


grep getrlimit /usr/share/man/*/* 
在 某 些 系统 上 可 能 产生 如 下 形式 的 shell 错误 : 
Argument list too long 


由 于 历史 原因 , System V 中 此 限制 值 是 5 120 字 节 。 早 期 BSD 系统 的 此 限制 值 是 20 480 字 节 。 
当前 系统 中 ， 此 限制 值 要 大 得 多 。( 如 图 2-14 所 示 的 程序 的 输出 ， 图 2-15 总 结 列 出 了 限制 值 。) 


为 了 摆脱 对 参数 表 长 度 的 限制 , 我 们 可 以 使 用 xargs(1) 命 令 , 将 长 参数 表 断 开 成 几 部 分 。 为 
了 寻找 在 我 们 所 用 系统 手册 页 中 的 getzlimit， 我 们 可 以 用 


find /usr/share/man -type f -print | xargs grep getrlimit 
如 果 所 用 的 系统 手册 页 是 压缩 过 的 ， 则 可 使 用 


find /usr/share/man -type f -print | xargs bzgrep getrlimit 


对 于 find 命令 ， 我 们 使 用 选项 -type f， 以 限制 输出 列表 只 包含 普通 文件 。 这 样 做 的 原因 是 ， 
grep 命令 不 能 在 目录 中 进行 模式 搜索 ， 我 们 也 想 避 免 不 必 要 的 出 错 消息 。 

前 面 曾 提 及 ， 在 执行 exec 后 ， 进 程 ID 没有 改变 。 但 新 程序 从 调用 进程 继承 了 的 下 列 属性 ; 

。 进程 ID 和 父 进程 DD 

。 实际 用 户 ID 和 实际 组 ID 

。 附属 组 ID 

。 进程 组 ID 

。 Ais ID 

。 控制 终端 

e。 闹钟 尚 余 留 的 时 间 

e 当前 工作 目录 

。 根 目录 

。 文件 模式 创建 屏蔽 字 

。 文件 锁 

。 进程 信号 屏蔽 

。 未 处 理 信号 

。 资源 限制 

e nice 值 (遵循 XSI 的 系统 ， 见 8.16 节 ) 

e tms utime,. tms stime、tms_cutime 以 及 tms_cstime 值 

对 打开 文件 的 处 理 与 每 个 描述 符 的 执行 时 关闭 (close-on-exec) 标志 值 有 关 。 回 忆 图 3-7 以 及 
3.14 节 中 对 FD_CLOEXEC 标志 的 说 明 , 进程 中 每 个 打开 描述 符 都 有 一 个 执行 时 关闭 标志 。 若 设置 
了 此 标志 ， 则 在 执行 exec 时 关闭 该 描述 符 ; 否则 该 描述 符 仍 打开 。 除 非特 地 用 fcnt1 设置 了 该 
执行 时 关闭 标志 ， 否 则 系统 的 默认 操作 是 在 exec 后 仍 保持 这 种 描述 符 打开 。 

POSIX.1 明确 要 求 在 exec 时 关闭 打开 目录 流 ( 见 4.22 节 中 所 述 的 opendir 函数 )。 这 
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通常 是 由 opendir 函数 实现 的 ， 它 调用 fcntl 函数 为 对 应 于 打开 目录 流 的 描述 符 设 置 执 
行 时 关闭 标志 。 

注意 ， 在 exec 前 后 实际 用 户 ID 和 实际 组 ID 保持 不 变 ， 而 有 效 D 是否 改 变 则 取决 于 所 执行 程 
序 文件 的 设置 用 户 ID 位 和 设置 组 ID 位 是 否 设置 。 如 果 新 程序 的 设置 用 户 ID 位 已 设置 ， 则 有 效用 户 
ID 变 成 程序 文件 所 有 者 的 ID; 否则 有 效用 户 ID 不 变 。 对 组 ID 的 处 理 方式 与 此 相同 。 

在 很 多 UNIX 实现 中 , 这 7 个 函数 中 只 有 execve 是 内 核 的 系统 调用 。 另外 6 个 只 是 库 函 数 ， 
它们 最 终 都 要 调用 该 系统 调用 。 这 7 个 函数 之 间 的 关系 示 于 图 8-15 中 。 


execle 


建立 argv 









execlp 















建立 argu 


execv 








execve 


(系统 调用 ) 











execvp 


PATH 前 级 


environ 








build path from 
/proc/self/fd 
alias 


fexecve 


Al 8-15 7 个 exec 函数 之 间 的 关系 
在 这 种 安排 中 ， 库 函数 execlp 和 execvp 使 用 PATH 环境 变量 ， 查 找 第 一 个 包含 名 为 
filename 的 可 执行 文件 的 路 径 名 前 级 。 fexecve 库 函 数 使 用 /proc 把 文件 描述 符 参 数 转 换 成 路 径 
名 ，execve 用 该 路 径 名 去 执行 程序 。 


这 描述 了 在 FreeBSD 8.0 Linux 3.2.0 中 是 如 何 实现 £execve 的 。 其 他 系统 采用 的 方法 可 能 不 
同 。 例 如 , 没有 /proc 和 /dev/fd 的 系统 可 能 把 fexecve 实现 为 系统 调用 ， 把 文件 描述 符 参 数 转 
换 成 i 节点 指针 ， 把 execve 实现 为 系统 调用 ， 把 路 径 名 参数 转换 成 i 节点 指针 ， 然 后 把 execve 
和 fexecve 中 剩余 的 exec 公共 代码 放 到 单独 的 函数 中 ,调用 该 函数 时 传 入 执行 文件 的 ji 节点 指针 。 


时 实例 
图 8-16 中 的 程序 演示 了 exec 函数 。 


#include "apue.h" 
#include <sys/wait.h> 


char *env_init[] = { "USER-unknown", "PATH=/tmp", NULL }; 


int 
main (void) 
{ 
pid 七 pid; 


if ((pid = fork()) < 0) { 
err sys("fork error"); 
} else if (pid == 0) { /* specify pathname, specify environment */ 
if (execle("/home/sar/bin/echoall", "echoall", "myargl", 
"MY ARG2", (char *)0, env init) < 0) 
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err_sys("execle error"); 


) 


if (waitpid(pid, NULL, 0) < 0) 
err sys("wait error"); 


if ((pid = fork()) « 0) { 
err sys("fork error"); 
} else if (pid == 0) { /* specify filename, inherit environment */ 
if (execlp("echoall", "echoall", "only 1 arg", (char *)0) < 0) 
err sys("execlp error"); 


} 


exit (0); 


8-16 exec 函数 实例 

在 该 程序 中 先 调用 execle, 它 要 求 一 个 路 径 名 和 一 个 特定 的 环境 。 下 一 个 调用 的 是 execlp， 
它 用 一 个 文件 名 ， 并 将 调用 者 的 环境 传送 给 新 程序 。execlp 在 这 里 能 够 工作 是 因为 目录 
/home/sar/bin 是 当前 路 径 前 缀 之 一 。 注 意 ， 我 们 将 第 一 个 参数 (新 程序 中 的 argv[0] ) & 
置 为 路 径 名 的 文件 名 分 量 。 某 些 shell 将 此 参数 设置 为 完全 的 路 径 名 。 这 只 是 一 个 惯例 。 我 们 可 将 
argv[0] 设置 为 任何 字符 串 。 当 Login 命令 执行 shell 时 就 是 这 样 做 的 .在 执行 shell 之 前 , login 
在 argv[0] 之 前 加 一 个 /作为 前 级 ， 这 向 shell 指明 它 是 作为 登录 shell 被 调用 的 。 登 录 shell 将 执 
行 启动 配置 文件 (start-up profile) 命令 ， 而 非 登 录 shell 则 不 会 执行 这 些 命令 。 

图 8-16 中 的 程序 要 执行 两 次 的 echoal1l 程序 如 图 8-17 所 示 。 这 是 一 个 很 普通 的 程序 , 它 回 
显 所 有 命令 行 参数 及 全 部 环境 表 。 


#include "apue.h" 





int 
main(int argc, char *argv[]) 
{ 
int i; 
char *"*otr; 
extern char  **environ; 


for {i 0; i « argo; i++) /* echo all command-line args */ 
printf("argv[$d]: $sNMn", i, argv[i]); 


for (ptr = environ; *ptr != 0; Ptr++)  /* and all env strings */ 
printf("%s\n", *ptr); 


exit(0); 


图 8-17 回 显 所 有 命令 行 参数 和 所 有 环境 字符 串 
执行 图 8-16 中 的 程序 得 到 : 


$ ./a.out 
argv[0]: echoall 
argv[1]: myargi 
argv[2]: MY ARG2 
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USER=unknown 
PATH=/tmp 
argv[0]: echoall 
$ argv[1]: only 1 arg 
USER-sar 
LOGNAME-sar 
SHELL-/bin/bash 
还 有 47 行 没有 列 出 
HOME=/home/sar 


YER, shell 提示 符 出 现在 第 二 个 exec 打印 argv[0] 之 前 。 这 是 因为 父 进 程 并 不 等 待 该 子 进程 
结束 。 se 


8.11 更 改 用 户 ID 和 更 改组 ID 


在 UNIX 系统 中 ， 特 权 〈 如 能 改变 当前 日 期 的 表示 法 ) 以 及 访问 控制 (如 能 否 读 、 写 一 个 特 
定 文件 )， 是 基于 用 户 ID 和 组 ID 的 。 当 程序 需要 增加 特权 ， 或 需要 访问 当前 并 不 允许 访问 的 资 
源 时 ， 我 们 需要 更 换 自 己 的 用 户 ID 或 组 ID， 使 得 新 ID 具有 合适 的 特权 或 访问 权限 。 与 此 类 似 ， 
当 程 序 需要 降低 其 特权 或 阻止 对 某 些 资源 的 访问 时 , 也 需要 更 换 用 户 ID 或 组 ID, 新 ID 不 具有 相 
应 特权 或 访问 这 些 资源 的 能 力 。 

一 般 而 言 ， 在 设计 应 用 时 ， 我 们 总 是 试图 使 用 最 小 特权 (least privilege) 模型 。 依 照 此 模型 ， 
我 们 的 程序 应 当 只 具有 为 完成 给 定 任务 所 需 的 最 小 特权 。 这 降低 了 由 恶意 用 户 试 图 哄骗 我 们 的 程 
序 以 未 预料 的 方式 使 用 特权 造成 的 安全 性 风险 。 

可 以 用 setuid 函数 设置 实际 用 户 ID 和 有 效用 户 ID。 与 此 类 似 ， 可 以 用 setgid 函数 设置 
实际 组 ID 和 有 效 组 ID. 


#include <unistd.h> 


int setuid(uid t uid); 


int setgid(gid t gid); 





关于 谁 能 更 改 ID 有 若干 规则 。 现 在 先 考 虑 更 改 用 户 ID 的 规则 (关于 用 户 ID 我 们 所 说 明 的 
一 切 都 适用 于 组 ID )。 

CD 若 进 程 具有 超级 用 户 特 权 ， 则 setuid 函数 将 实际 用 户 ID、 有 效用 户 ID 以 及 保存 的 设 
置 用 户 ID (saved set-user-ID) KEW uid. 

(2) 车 进程 没有 超级 用 户 特权 , 但 是 uid 等 于 实际 用 户 ID 或 保存 的 设置 用 户 ID, 则 setuid 
只 将 有 效用 户 ID 设置 为 wid。 不 更 改 实际 用 户 ID 和 保存 的 设置 用 户 ID。 

(3) 如 果 上 面 两 个 条 件 都 不 满足 ， 则 errno 设置 为 PERM， 并 返回 -1。 

在 此 假定 _POSIX_SAVED_IDS 为 真 。 如 果 没 有 提供 这 种 功能 ， 则 上 面 所 说 的 关于 保存 的 设 
置 用 户 ID 部 分 都 无 效 。 


在 POSIX.1 2001 版 中 ,保存 的 ID 是 强制 性 功能 。 而 在 较 早 版 本 中 ， 它 们 是 可 选择 的 。 为 了 
弄 清 楚 某 种 实现 是 否 支持 这 一 功能 ， 应 用 程序 在 编译 时 可 以 测试 常量 POSIOX SAVED IDS, X 
者 在 运行 时 以 _SC_SAVED_IDS 参数 调用 sysconf BK, 
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关于 内 核 所 维护 的 3 个 用 户 ID， 还 要 注意 以 下 几 点 。 

(1) 只 有 超级 用 户 进程 可 以 更 改 实际 用 户 ID.。 通 常 ,实际 用 户 ID 是 在 用 户 登 录 时 , 由 login(1) 
程序 设置 的 ， 而 且 决 不 会 改变 它 。 因 为 login 是 一 个 超级 用 户 进程 ， 当 它 调用 setuid 时 ， 设 
置 所 有 3 个 用 户 ID。 

(2) 仅 当 对 程序 文件 设置 了 设置 用 户 ID 位 时 ，exec 函数 才 设 置 有 效用 户 ID。 如 果 设 置 用 户 ID 
位 没有 设置 ，exec 函数 不 会 改变 有 效用 户 ID， 而 将 维持 其 现 有 值 。 任 何 时 候 都 可 以 调用 setuid, 将 
有 效用 户 ID 设置 为 实际 用 户 ID 或 保存 的 设置 用 户 ID 。 自然 地 , 不 能 将 有 效用 户 ID 设置 为 任 一 随机 值 。 

(3) 保存 的 设置 用 户 ID 是 由 exec 复制 有 效用 户 ID 而 得 到 的 。 如 果 设 置 了 文件 的 设置 用 户 ID 位 ， 

则 在 exec 根据 文件 的 用 户 ID 设置 了 进程 的 有 效用 户 ID 以 后 ， 这 个 副本 就 被 保存 起 来 了 。 
图 8-18 总 结 了 更 改 这 3 个 用 户 ID 的 不 同方 法 。 


一 Te 
设置 用 户 ID 位 关闭 设置 用 户 ID 位 打开 | 超级 用 户 非特 权 用 户 


实际 用 户 ID 不 变 不 变 WA uid 
有 效用 户 ID 不 变 设置 为 程序 文件 的 用 户 ID 设 为 uid BW uid 
保存 的 设置 用 户 ID 从 有 效用 户 IDÉES | 从 有 效用 户 ID 复制 BA uid 
图 8-18 更改 3 个 用 户 ID 的 不 同方 法 
VER, 8.2 节 中 所 述 的 getuid 和 geteuid 函数 只 能 获得 实际 用 户 ID 和 有 效用 户 ID 的 当前 
值 。 我 们 没有 可 移植 的 方法 去 获得 保存 的 设置 用 户 ID 的 当前 值 。 
FreeBSD 8.0 和 LINUX 3.2.0 提供 了 getresuid # getresgid 函数 ， 它 们 可 以 分 别 用 于 获 
取保 存 的 设置 用 户 ID 和 保存 的 设置 组 ID。 





1. RR setreuid 和 setregid 
历史 上 ，BSD 支持 setreuid 函数 ， 其 功能 是 交换 实际 用 户 ID 和 有 效用 户 ID 的 值 。 
#include <unistd.h> 


int setreuid(uid t ruid, uid t euid); 


int setregid(gid t rgid, gid t egid); 





两 个 函数 返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -! 
如 若 其 中 任 一 参数 的 值 为 -1， 则 表示 相应 的 ID 应 当 保 持 不 变 。 
规则 很 简单 : 一 个 非特 权 用 户 总 能 交换 实际 用 户 ID 和 有 效用 户 ID。 这 就 允许 一 个 设置 用 户 ID 程 
序 交 换 成 用 户 的 普通 权限 ， 以 后 又 可 再 次 交换 回 设置 用 户 ID 权限 。POSIX.1 引进 了 保存 的 设置 用 户 ID 
特性 后 ， 其 规则 也 相应 加 强 ， 它 允许 一 个 非特 权 用 户 将 其 有 效用 户 ID 设置 为 保存 的 设置 用 户 ID. 


seteuid 和 setregid 两 个 函数 都 是 Single UNIX Specification 的 XSI 扩展 。 因 此 ， 可 以 期 
望 所 有 UNIX 系统 实现 都 将 对 它们 提供 支持 。 
4.3BSD 并 没有 上 面 所 说 的 保存 的 设置 用 户 ID 特性 ,而 是 使 用 setreuid 和 setregid 来 代替 。 
这 就 多 许 一 个 非特 权 用 户 交 换 这 两 个 用 户 ID 的 值 ， 但 是 要 注意 ， 当 使 用 此 特性 的 程序 生成 shell 进程 
时 ， 它 必须 在 exec 之 前 先 将 实际 用 户 ID 设置 为 普通 用 户 ID。 如 果 不 这 样 做 的 话 ， 实 际 用 户 ID 就 可 
能 是 具有 特权 的 ( 由 setreuid 的 交换 操作 造成 ),， 然后 shell 进程 可 能 会 调用 setreuid 交换 两 个 用 
P ID 值 并 取得 更 多 权限 。 作 为 一 个 保护 性 的 解决 这 一 问题 的 编程 措施 ,程序 在 子 进程 调用 exec 
之 前 ， 将 子 进程 的 实际 用 户 ID 和 有 效用 户 ID 都 设置 成 普通 用 户 ID。 
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2. 函数 seteuid 和 setegid 
POIX.1 包含 了 两 个 函数 seteuid 和 setegid. 它们 类 似 于 setuid 和 setgid, 但 只 更 改 
有 效用 户 ID 和 有 效 组 ID。 


#include <unistd.h> 


int seteuid(uid_t wid); 


int setegid(gid_t gid); 
两 个 函数 返回 值 ， 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 
一 个 非特 权 用 户 可 将 其 有 效用 户 ID 设置 为 其 实际 用 户 ID 或 其 保存 的 设置 用 户 ID。 对 于 一 个 
特权 用 户 则 可 将 有 效用 户 ID 设置 为 wid。( 这 区 别 于 setuid 函数 ， 它 更 改 所 有 3 TAP ID.) 
图 8-19 给 出 了 本 节 所 述 的 更 改 3 个 不 同 用 户 ID 的 各 个 函数 。 
超级 用 户 超级 用 户 超级 用 户 


setreuid(ruid, euid) setuid(uid) seteuid(uid) 


ruid 
实际 用 户 ID 






















保存 的 
设置 -用户 ID 


非特 权 的 


setreuid 









exec 


设置 用 户 ID 





非特 权 的 非特 权 的 


setuid HK seteuid setuid NK seteuid 


8-19 设置 不 同 用 户 ID 的 各 函数 
3. 组 ID 
本 章 中 所 说 明 的 一 切 都 以 类 似 方式 适用 于 各 个 组 ID。 附 属 组 ID 不 受 setgid. setregid 
和 setegid 函数 的 影响 。 


oe 
m BA 
为 了 说 明 保 存 的 设置 用 户 ID 特性 的 用 法 ， 先 观察 一 个 使 用 该 特性 的 程序 。 我 们 所 观察 的 是 
at(1) 程 序 ， 它 用 于 调度 将 来 某 个 时 刻 要 运行 的 命令 。 

在 Linux 3.2.0 上 安装 的 at 程序 的 设置 用 户 ID 是 daemon 用 户 。 在 FreeBSD 8.0、Mac OS X 
10.6.8 以 及 Solaris 10 上 安装 的 at 程序 的 设置 用 户 ID root MP. RAH at 命令 对 守护 进程 
拥有 的 特权 文件 具有 写 权 限 , 守护 进程 代表 用 户 运行 at 命令 。 在 Linux 3.2.0 E, 程序 是 用 atd(8) 
守护 进程 运行 的 。 在 FreeBSD 8.0 和 Solaris 10 上 ， 程 序 通过 cron(1M) 守 护 进程 运行 。 在 Mac OS 

X 10.6.8 上 上， 程序 通过 launchd(8) 守 护 进 程 运行 。 


为 了 防止 被 欺骗 而 运行 不 被 允许 的 命令 或 读 、 写 没有 访问 权限 的 文件 ，at 命令 和 最 终 代表 
用 户 运 行 命令 的 守护 进程 必须 在 两 种 特权 之 间 切 换 : 用 户 特权 和 守护 进程 特权 。 下 面 列 出 了 其 
工作 步骤 。 
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(1) 程序 文件 是 由 root 用 户 拥 有 的 ， 并 且 其 设置 用 户 ID 位 已 设置 。 当 我 们 运行 此 程序 时 ， 
得 到 下 列 结果 : 
实际 用 户 ID= 我 们 的 用 户 ID 〈 未 改变 ) 
有 效用 户 ID-root 
保存 的 设置 用 户 ID=root 
(2) at 程序 做 的 第 一 件 事 就 是 降低 特权 ， 以 用 户 特权 运行 。 它 调用 setuid 函数 把 有 效用 
PID 设置 为 实际 用 户 ID。 此 时 得 到 : 
实际 用 户 ID= 我 们 的 用 户 ID (RAE) 
有 效用 户 ID= 我 们 的 用 户 ID 
保存 设置 用 户 ID=root (未 改变 ) 

(3) at 程序 以 我 们 的 用 户 特权 运行 ， 直 到 它 需 要 访问 控制 哪些 命令 即将 运行 ， 这 些 命 
令 需要 何 时 运行 的 配置 文件 时 ，at 程序 的 特权 会 改变 。 这 些 文件 由 为 用 户 运行 命令 的 守护 
进程 持 有 。at 命令 调用 setuid 函数 把 有 效用 户 ID RX root, HA setuid 的 参数 等 于 
保存 的 设置 用 户 ID, 所 以 这 种 调用 是 许可 的 (这 就 是 为 什么 需要 保存 的 设置 用 户 ID 的 原因 )。 
现在 得 到 : 

实际 用 户 ID= 我 们 的 用 户 ID (RAE) 
有 效用 户 ID-root 
保存 的 设置 用 户 ID=root (未 改变 ) 

因为 有 效用 户 ID 是 root， 文 件 访 问 是 允许 的 。 

(4) 修改 文件 从 而 记录 了 将 要 运行 的 命令 以 及 它们 的 运行 时 间 以 后 ，at 命令 通过 调用 seteuid, 
把 有 效用 户 ID 设置 为 用 户 ID， 降 低 它 的 特权 。 防 止 对 特权 的 误 用 。 此 时 我 们 可 以 得 到 ， 

实际 用 户 ID= 我 们 的 用 户 ID (RAE) 
有 效用 户 ID= 我 们 的 用 户 ID 
保存 的 设置 用 户 ID-root (未 改变 ) 

(5) 守护 进程 开始 用 root 特权 运行 ， 代 表 用 户 运行 命令 ， 守 护 进程 调用 fork， 子 进 
程 调用 setuid 将 它 的 用 户 ID 更 改 至 我 们 的 用 户 ID。 因 为 子 进程 以 root 特权 运行 ， 更 改 
了 所 有 的 ID， 所 以 

实际 用 户 ID= 我 们 的 用 户 ID 
有 效用 户 ID= 我 们 的 用 户 ID 
保存 的 设置 用 户 ID= 我 们 的 用 户 ID 

现在 守护 进程 可 以 安全 地 代表 我 们 执行 命令 ， 因 为 它 只 能 访问 我 们 通常 可 以 访问 的 文件 ， 我 
们 没有 额外 的 权限 。 

以 这 种 方式 使 用 保存 的 设置 用 户 ID， 只 有 在 需要 提升 特权 的 时 候 ， 我 们 通过 设置 程序 文件 的 
设置 用 户 ID 而 得 到 的 额外 权限 。 然 而 ， 其 他 时 间 进 程 在 运行 时 只 具有 普通 的 权限 。 如 果 进 程 不 
能 在 其 结束 部 分 切换 回 保存 的 设置 用 户 ID， 那么 就 不 得 不 在 全 部 运行 时 间 都 保持 额外 的 权限 (这 
可 能 会 造成 麻烦 )。 a 


8.12 解释 器 文件 


所 有 现今 的 UNIX 系统 都 支持 解释 器 文件 Cinterpreter file)。 这 种 文件 是 文本 文件 ， 其 起 始 行 


208 第 8 章 进程 控制 


的 形式 是 : 
#! pathname [ optional-argument ] 


在 感叹 号 和 pathname 之 间 的 空格 是 可 选 的 。 最 常见 的 解释 器 文件 以 下 列 行 开 始 : 


4$! /bin/sh 


Patpnaame 通 常 是 绝对 路 径 名 ,对 它 不 进行 什么 特殊 的 处 理 ( 不 使 用 PATH 进行 路 径 搜 索 )。 
对 这 种 文件 的 识别 是 由 内 核 作 为 exec 系统 调用 处 理 的 一 部 分 来 完成 的 。 内 核 使 调用 exec 
函数 的 进程 实际 执行 的 并 不 是 该 解释 器 文件 ， 而 是 在 该 解释 器 文件 第 一 行 中 pathname 所 指 
定 的 文件 。 一 定 要 将 解释 器 文件 〈 文 本 文件 ， 它 以 #! 开 头 ) 和 解释 器 〈 由 该 解释 器 文件 第 一 行 
中 的 pathname 指定 ) 区 分 开 来 。 

很 多 系统 对 解释 器 文件 第 一 行 有 长 度 限 制 。 这 包括 #1!、pathname、 可 选 参 数 、 终 止 换行 符 以 
及 空格 数 。 


| 在 FreeBSD 8.0 中 , 该 限制 是 4 097 字 节 。Linux 3.2.0 中 , 该 限制 为 128 字 节 。 Mac OS X 10.6.8 
260 | 中 ， 该 限制 为 513 字 节 ， 而 Solaris 10 的 限制 是 1 024 字 节 。 


ga XP 


让 我 们 观察 一 个 实例 ， 从 中 可 了 解 当 被 执行 的 文件 是 个 解释 器 文件 时 ， 内 核 如 何 处 理 exec 
函数 的 参数 及 该 解释 器 文件 第 一 行 的 可 选 参数 ,图 8-20 中 的 程序 调用 exec 执行 一 个 解释 器 文件 。 


#include "apue.h" 
#include <sys/wait.h> 


int 
main (void) 
{ 
pid t pid; 


if ((pid = fork()) < 0) { 
err sys("fork error"); 


) else if (pid == 0) ( /*. child */ 
if (execl("/home/sar/bin/testinterp", 
"testinterp", "myargl", "MY ARG2", (char *)0) < 0) 


err sys("execl error"); 
) 
if (waitpid(pid, NULL, 0) « 0) /* parent */ 
err sys("waitpid error"); 
exit(0); 


图 8-20 ”执行 一 个 解释 器 文件 的 程序 


下 面 先 显示 要 被 执行 的 该 解释 器 文件 的 内 容 〈 只 有 一 行 )， 接 着 是 运行 图 8-20 中 的 程序 得 到 
的 结果 。 


$ cat /home/sar/bin/testinterp 
$!/home/sar/bin/echoarg foo 

$ ./a.out 

argv[0]: /home/sar/bin/echoarg 
argv[1]: foo 
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argv[2]: /home/sar/bin/testinterp 
argv[3]: myargl 
argv[4]: MY ARG2 


程序 echoarg (解释 器 ) 回 显 每 一 个 命令 行 参数 〔 它 就 是 图 7-4 中 的 程序 )。 注 意 ， 当 内 核 exec 
解释 器 (/home/sar/bin/echoarg) 时 ，argv[0] 是 该 解释 器 的 pathname，argv[1] 是 解释 
器 文件 中 的 可 选 参数 ， 其 余 参 数 是 pathname (/home/sar/bin/testinterp) 以 及 图 8-20 
所 示 的 程序 中 调用 execl 的 第 2 个 和 第 3 个 参数 (myarg1 和 MY ARG2)。 调 用 execl 时 的 argv[1] 
和 argv[2] 已 右 移 了 两 个 位 置 。 注 意 ， 内 核 取 execl 调用 中 的 pathname 而 非 第 一 个 参数 


(testinterp)， 因 为 一 般 而 言 ，pathname 包含 了 比 第 一 个 参数 更 多 的 信息 。 " 
"EA, 


在 解释 器 pathname 后 可 跟随 可 选 参数 。 如 果 一 个 解释 器 程序 支持 -f 选项 ， 那 么 在 pathname 
后 经 常 使 用 的 就 是 -f。 例 如 ， 可 以 以 下 列 方式 执行 awk(1) 程 序 : 


awk -f myfile 


它 告诉 awk 从 文件 myfile Pik awk 程序 。 


Æ UNIX System V 派生 的 很 多 系统 中 , 常 包 含有 awk 语言 的 两 个 版 本 。awk 常常 被 称 为 “ 老 
awk”, '£X 5 V7 一 起 分 发 的 原始 版 本 。nawk (新 awk) 包含 了 很 多 增强 功能 ， 对 应 于 在 Aho、 
Kemighan 和 Weinberger[1988] 中 说 明 的 语言 。 此 新 版 本 提供 了 对 命令 行 参 数 的 访问 ， 这 是 下 面 的 
例子 所 需 的 。Solaris 10 提供 了 两 个 版 本 。 

POSIX 1003.2 标准 现在 是 Single UNIX Specification 中 基本 POSIX.1 规范 的 一 部 分 。 在 该 标准 中 , awk f£ 
序 是 其 中 的 一 个 实用 程序 。 该 实用 程序 的 基础 也 是 Aho、Kemighan 和 Weinberger[1988] 中 所 描述 的 语言 。 

Mac OS X 10.6.8 中 的 awk 版 本 基于 贝尔 实验 室 版 本 ， 并 已 将 其 放 在 公共 域 public domain ) 
中 。FreeBSD 8.0 和 Linux 的 某 些 发 行 版 提供 GNU awk ( gawk )， 它 链接 至 名 字 awk, gawk 版 本 
遵循 POSIX 标准 , 但 也 包括 了 一 些 扩 展 。 因 为 gawk 和 贝尔 实验 室 的 awk 版 本 比较 新 ， 所 以 较 之 
nawk 或 老 版 本 的 awk 更 受 人 欢迎 。( 贝尔 实验 室 的 awk 版 本 可 从 http://cm.bell- 
labs.com/cm/cs/awkbook/index.html 获取 。) 


在 解释 器 文件 中 使 用 -上 选项 ， 可 以 写成 : 


#!/bin/awk -f 
(在 此 解释 器 文件 中 后 跟随 awk 程序 ) 


例如 ， 图 8-21 展示 了 在 /usr/local/bin/awkexample 中 的 一 个 解释 器 文件 程序 。 


#!/usr/bin/awk -f 
# Note: on Solaris, use nawk instead 
BEGIN { 
for (i = 0; i < ARGC; i++) 
printf "ARGV[%d] = %s\n", i, ARGV[i] 
exit 





图 8-21 ”作为 解释 器 文件 的 awk 程序 
如 果 路 径 前 缀 之 一 是 /usr/1local/bin， 则 可 以 用 下 列 方式 执行 图 8-21 中 的 程序 (假定 我 
们 已 打开 了 该 文件 的 执行 位 ): 
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$ awkexample filel FILENAME2 f3 


ARGV[0] = awk 
ARGV[1] = filel 
ARGV(2] = FILENAME2 
ARGV[3] = £3 


HUT /bin/awk 时 ， 其 命令 行 参数 是 : 

/bin/awk -f /usr/local/bin/awkexample filel FILENAME2 f3 
解释 器 文件 的 路 径 名 C/usr/local/bin/awkexample) 被 传送 给 解释 器 。 因 为 不 能 期 望 解释 
器 〈 在 本 例 中 是 /bin/awk) 会 使 用 PATH 变量 定位 该 解释 器 文件 ， 所 以 只 传送 其 路 径 名 中 的 文 
件 名 是 不 够 的 ， 要 将 解释 器 文件 完整 的 路 径 名 传送 给 解释 器 。 当 awk 读 解 释 器 文件 时 ， 因 为 # 是 
awk 的 注释 字符 ， 所 以 它 忽略 第 一 行 。 

可 以 用 下 列 命令 验证 上 述 命令 行 参数 。 


$ /bin/su 成 为 超级 用 户 

Password: 输入 超级 用 户口 令 

# mv /usr/bin/awk /usr/bin/awk.save 保存 原先 的 程序 

# cp /home/sar/bin/echoarg /usr/bin/awk 暂时 替换 它 

# suspend 用 作业 控制 挂 起 超级 用 户 shell 
[1] + Stopped /bin/su 


$ awkexample filel FILENAME2 f£3 
argv[0]: /bin/awk 

argv[i]: =£ 

argv[2]: /usr/local/bin/awkexample 
argv[3]: filel 

argv[4]: FILENAME2 


argv[5]: £3 

$ fg 用 作业 控制 恢复 超级 用 户 shell 
/bin/su 

4 mv /usr/bin/awk.save /usr/bin/awk 恢复 原先 的 程序 

# exit 终止 超级 用 户 shell 


在 此 例子 中 ， 解 释 器 的 -f 选项 是 必需 的 。 正 如 前 述 ， 它 告诉 awk 在 什么 地 方 找到 awk 程序 。 如 
果 在 解释 器 文件 中 删除 -f 选项 ， 则 在 试图 运行 该 解释 器 文件 时 , 通常 输出 一 条 出 错 消 息 。 该 出 错 
消息 的 精确 文本 可 能 有 所 不 同 ， 这 取决 于 解释 器 文件 存放 在 何 处 以 及 其 余 参 数 是 否 表示 现 有 的 文 
件 等 。 因 为 在 这 种 情况 下 命令 行 参数 是 : 

/bin/awk /usr/local/bin/awkexample filel FILENAME2 f3 


于 是 awk 企图 将 字符 串 /usr/local/bin/awkexample 解释 为 一 个 awk 程序 。 如 果 
不 能 向 解释 器 传递 至 少 一 个 可 选 参数 (在 本 例 中 是 -f)， 那 么 这 些 解 释 器 文件 只 有 对 shell 
才 是 有 用 的 。 a 

是 否 一 定 需要 解释 器 文件 呢 ? 那 也 不 完全 如 此 。 但 是 它们 确实 使 用 户 得 到 效率 方面 的 好 
处 ， 其 代价 是 内 核 的 额外 开销 (因为 识别 解释 器 文件 的 是 内 核 )。 由 于 下 述 理由 ， 解 释 器 文件 
是 有 用 的 。 

a) 有 些 程序 是 用 某 种 语言 写 的 脚本 ， 解 释 器 文件 可 将 这 一 事实 隐藏 起 来 。 例 如 ， 为 了 执行 
图 8-21 程序 ， 只 需 使 用 下 列 命令 行 : 


awkexample optional-arguments 


而 并 不 需要 知道 该 程序 实际 上 是 一 个 awk 脚本 ， 否 则 就 要 以 下 列 方式 执行 该 程序 : 
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awk -f awkexample optional-arguments 


(2) 解释 器 脚本 在 效率 方面 也 提供 了 好 处 。 再 考虑 一 下 前 面 的 例子 。 仍 旧 隐 藏 该 程序 是 一 个 
awk 脚本 的 事实 ， 但 是 将 其 放 在 一 个 shell 脚本 中 : 


awk ‘BEGIN | 
for (i = 0; i < ARGC; i++) 
printf "ARGV[%d] = %s\n", i, ARGV[i] 


exit 

)* $* 

这 种 解决 方法 的 问题 是 要 求 做 更 多 的 工作 。 首 先 ，shell 读 此 命令 ， 然 后 试图 execlp 此 文件 
名 。 因 为 shell 脚本 是 一 个 可 执行 文件 ， 但 却 不 是 机 器 可 执行 的 ， 于 是 返回 一 个 错误 ，execlp 就 
认为 该 文件 是 一 个 shell 脚本 〈 它 实际 上 就 是 这 种 文件 )。 然 后 执行 /bin/sh， 并 以 该 shell 脚本 
的 路 径 名 作为 其 参数 。 shell 正确 地 执行 我 们 的 shell 脚本 , 但 是 为 了 运行 awk 程序 , 它 调用 fork, 
exec 和 wait。 于 是 ， 用 一 个 shell 脚本 代替 解释 器 脚本 需要 更 多 的 开销 。 

(3) 解释 器 脚本 使 我 们 可 以 使 用 除 /bin/sh 以 外 的 其 他 shell 来 编写 shell 脚本 。 当 execlp 
找到 一 个 非 机 器 可 执行 的 可 执行 文件 时 ， 它 总 是 调用 /bin/sh 来 解释 执行 该 文件 。 但 是 ， 用 解释 
器 脚本 则 可 简单 地 写成 : 


#!/bin/csh 
(在 解释 器 文件 中 后 跟随 C shell 脚本 ) 


再 一 次 ， 我 们 也 可 将 此 放 在 一 个 /bin/sh 脚本 中 《然后 由 其 调用 C shell)， 但 是 要 有 更 多 的 开销 。 
如 果 3 个 shell 和 awk 没有 用 # 作 为 注释 符 ， 则 上 面 所 说 的 都 无 效 。 


8.13 AŽ system 


在 程序 中 执行 一 个 命令 字符 串 很 方便 。 例 如 ， 假 定 要 将 时 间 和 日 期 放 到 某 一 个 文件 中 ， 则 可 
使 用 6.10 节 中 的 函数 实现 这 一 点 。 调 用 time 得 到 当前 日 历时 间 ， 接 着 调用 Localtime 将 日 历 
时 间 变 换 为 年 、 月 、 日 、 时 、 分 、 秒 、 周 日 的 分 解 形式 ， 然 后 调用 strftime 对 上 面 的 结果 进行 
格式 化 处 理 ， 最 后 将 结果 写 到 文件 中 。 但 是 用 下 面 的 system 函数 则 更 容易 做 到 这 一 点 : 


system("date > file"); 


ISO C 定义 了 system 函数 ， 但 是 其 操作 对 系统 的 依赖 性 很 剖 。POSIX.1 包括 了 system 接 
口 ， 它 扩展 了 ISO C 定义 ， 描 述 了 system 在 POSIX.1 环境 中 的 运行 行为 。 


#include <stdlib.h> 


int system(const char *emdstring) ; 





返回 值 : (WF) 


如 果 emdstring 是 一 个 空 指针 ， 则 仅 当 命令 处 理 程 序 可 用 时 ，system 返回 非 0 值 ， 这 一 特征 
可 以 确定 在 一 个 给 定 的 操作 系统 上 是 否 支 持 system 函数 。 在 UNIX 中 ，system 总 是 可 用 的 。 

因为 system 在 其 实现 中 调用 了 fork, exec 和 waitpid， 因 此 有 3 种 返回 值 。 

(1) fork 失败 或 者 waitpid 返回 除 EINTR 之 外 的 出 错 ， 则 system 返回 -1， 并 且 设 置 
errno 以 指示 错误 类 型 。 

(2) 如 果 exec 失败 (表示 不 能 执行 shell)， 则 其 返回 值 如 同 shell 执行 了 exit (127) 
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一 样 。 
(3) 否则 所 有 3 个 函数 (fork, exec 和 waitpid) MMI, 那么 system 的 返回 值 是 shell 
的 终止 状态 ， 其 格式 已 在 waitpid 中 说 明 。 


如 果 waitpid 被 一 个 捕捉 到 的 信号 中 断 ， 则 某 些 早 期 的 system 实现 都 返回 错误 类 型 值 

EINTR。 但 是 ， 因 为 没有 可 用 的 策略 能 让 应 用 程序 从 这 种 错误 类 型 中 恢复 ( 子 进 程 的 进程 ID 对 调 

| 用 者 来 说 是 未 知 的 )。 POSIX 后 来 增加 了 下 列 要 求 ; 在 这 种 情况 下 system 不 返回 一 个 错误 。( 10.5 
， 节 中 将 讨论 被 中 断 的 系统 调用 。) 


8-22 中 的 程序 是 system 函数 的 一 种 实现 。 它 对 信号 没有 进行 处 理 。10.18 节 中 将 修改 此 
函数 使 其 进行 信号 处 理 。 


#include <sys/wait.h> 
#include <errno.h> 
#include <unistd.h> 


int 
system(const char *cmdstring) /* version without signal handling */ 
{ 

pid t pid; 

int status; 


if (cmdstring == NULL) 
return(1); /* always a command processor with UNIX */ 


if ((pid = fork()) < 0) { 


status = -1; /* probably out of processes */ 
) else if (pid == 0) { l /* child */ 
execl("/bin/sh", "sh", "-c", cmdstring, (char *)0); 
exit (127); /* execl error */ 
) else ( /* parent */ 
while (waitpid(pid, &status, 0) « O) ( 
if (errno != EINTR) ( 
status - -1; /* error other than EINTR from waitpid() */ 
break; 


} 


return (status); 


图 8-22 system 函数 (没有 对 信号 进行 处 理 ) 

shell 的 -c 选项 告诉 shell 程序 取 下 一 个 命令 行 参数 (在 这 里 是 cmdstring) 作为 命令 输入 【而 
不 是 从 标准 输入 或 从 一 个 给 定 的 文件 中 读 命令 )。shell 对 以 null 字 节 终止 的 命令 字符 串 进行 语法 
分 析 ， 将 它们 分 成 命令 行 参数 。 传 递 给 shell 的 实际 命令 字符 串 可 以 包含 任 一 有 效 的 shell 命令 。 
例如 ， 可 以 用 < 和 > 对 输入 和 输出 重 定向 。 

如 果 不 使 用 shell 执行 此 命令 ， 而 是 试图 由 我 们 自己 去 执行 它 ， 那 将 相当 困难 。 首 先 ， 我 们 必 
AR execlp 而 不 是 exec1， 像 shell 那样 使 用 PATH 变量 。 我 们 必须 将 null 字 节 终止 的 命令 字 
符 串 分 成 各 个 命令 行 参数 ， 以 便 调用 execlp。 最 后 ， 我 们 也 不 能 使 用 任何 一 个 shell 元 字符 。 
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注意 ， 我 们 调用 _exit 而 不 是 exit。 这 是 为 了 防止 任 一 标准 VO 缓冲 〈 这 些 缓冲 会 在 fork 


中 由 父 进程 复制 到 子 进程 ) 在 子 进程 中 被 冲洗 。 


用 图 8-23 中 的 程序 对 这 种 实现 的 system 函数 进行 测试 (pr_exit 函数 定义 在 图 8-5 程序 中 )。 


#include "apue.h" 
#include <sys/wait.h> 


int 


main (void) 


{ 


int status; 


if ((status = system("date")) < 0) 
err_sys("system() error"); 


pr_exit (status) ; 


if ((status = system("nosuchcommand")) < 0) 
err sys("system() error"); 


pr exit(status); 


if ((status = system("who; exit 44")) < 0) 
err sys("system() error"); 


pr exit(status); 


exit(0); 


图 8-23 调用 system 函数 
运行 图 8-23 程序 得 到 : 


$ ./a.out 

Sat Feb 25 19:36:59 EST 2012 

normal termination, exit status = 0 对 于 date 

sh: nosuchcommand: command not found 

normal termination, exit status = 127 对 于 无 此 种 命令 


sar console Jan 1 14:59 
sar ttys000 Feb 7 19:08 
sar ttys001 Jan 15 15:28 
sar ttys002 Jan 15 21:50 
sar ttys003 Jan 21 16:02 
normal termination, exit status - 44 对 于 exit 


使 用 system 而 不 是 直接 使 用 fork 和 exec 的 优点 是 : system 进行 了 所 需 的 各 种 出 错 处 


理 以 及 各 种 信号 处 理 〈 在 10.18 节 中 的 下 一 个 版 本 system 函数 中 )。 


在 UNIX 的 早期 系统 中 ， 包 括 SVR3.2 和 4.3BSD， 都 没有 waitpid 函数 ， 于 是 父 进 程 用 下 


列 形式 的 语句 等 待 子 进程 : 


while ((lastpid = wait(&status)) != pid && lastpid != -1) 


如 果 调 用 system 的 进程 在 调用 它 之 前 已 经 生成 子 进程 ， 那 么 将 引起 问题 。 因 为 上 面 的 
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while 语句 一 直 循环 执行 ， 直 到 由 system 产生 的 子 进程 终止 才 停止 ， 如 果 不 是 用 pia 标识 的 
任 一 子 进程 在 pid 子 进 程 之 前 终止 , 则 它们 的 进程 ID 和 终止 状态 都 被 while 语句 丢弃 。 实 际 上 ， 
由 于 wait 不 能 等 待 一 个 指定 的 进程 以 及 其 他 一 些 原因 ，POSIX.1 Rationale 才 定 义 了 waitpid 
函数 。 如 果 不 提 供 waitpid 函数 ，popen 和 pclose 函数 也 会 发 生 同 样 的 问题 ( 见 15.3 节 )。 
设置 用 户 ID 程序 
如 果 在 一 个 设置 用 户 ID 程序 中 调用 system, WAEREA? 这 是 一 个 安全 性 方面 的 漏 
267) 洞 ， 决 不 应 当 这 样 做 。 图 8-24 程序 是 一 个 简单 程序 ， 它 只 是 对 其 命令 行 参数 调用 system 函数 。 


#include "apue.h" 





int 
main(int argc, char *argv[]) 
{ 

int status; 


if (argc < 2) 
err quit("command-line argument required"); 


if ((status = system(argv[1])) < 0) 
err sys("system() error"); 


pr exit(status); 


exit(0); 








图 8-24 用 system 执行 命令 行 参数 


将 此 程序 编译 成 可 执行 目标 文件 tsys。 
8-25 所 示 的 是 另 一 个 简单 程序 ， 它 打印 实际 用 户 ID 和 有 效用 户 ID. 





#include "apue.h" 


int 

main (void) 

{ 
printf ("real uid = %d, effective uid = d\n", getuid(), geteuid()); 
exit(0); 





图 8-25 打印 实际 用 户 ID 和 有 效用 户 ID 
将 此 程序 编译 成 可 执行 目标 文件 printuids。 运 行 这 两 个 程序 ， 得 到 如 下 结果 : 


$ tsys printuids 正常 执行 ， 无 特权 
real uid = 205, effective uid = 205 
normal termination, exit status = 0 


$ su 成 为 超级 用 户 
Password: 输入 超级 用 户口 令 

# chown root tsys 更 改 所 有 者 

# chmod u+s tsys 增加 设置 用 户 ID 

# 1s -1 tsys 检验 文件 权限 和 所 有 者 
-rwsrwxr-x 1 root 7888 Feb 25 22:13 tsys 

# exit 退出 超级 用 户 shell 


$ tsys printuids 
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real uid = 205, effective uid = 0 RF! 这 是 一 个 安全 性 漏洞 

normal termination, exit status = 0 
我 们 给 予 tsys 程序 的 超级 用 户 权限 在 system 中 执行 了 fork 和 exec 之 后 仍 被 保持 下 来 。 

有 些 实现 通过 更 改 /bin/sh， 当 有 效用 户 ID 与 实际 用 户 ID 不 匹配 时 ， 将 有 效用 户 ID 设置 
为 实际 用 户 ID, 这样 可 以 关闭 上 述 安 全 漏洞 。 在 这 些 系统 中 ， 上 述 示例 的 结果 就 不 会 发 生 。 不 管 
调用 system 的 程序 设置 用 户 ID 位 状态 如 何 ， 都 会 打印 出 相同 的 有 效用 户 ID。 

如 果 一 个 进程 正 以 特殊 的 权限 (设置 用 户 ID 或 设置 组 ID ) 运行 ， 它 又 想 生 成 男 一 个 进程 执 
行 另 一 个 程序 ， 则 它 应 当 直 接 使 用 fork 和 exec, MEHE fork 之 后 、exec 之 前 要 更 改 回 普通 
权限 。 设 置 用 户 ID 或 设置 组 ID 程序 决 不 应 调用 system 函数 。 

这 种 警告 的 一 个 理由 是 : system 调用 shell 对 命令 字符 串 进行 语法 分 析 ， 而 shell 使 用 IFS 
变量 作为 其 输入 字段 分 隔 符 。 早 期 的 shell 版 本 在 被 调用 时 不 将 此 变量 重 置 为 普通 字符 集 。 这 就 允 
许 一 个 恶意 的 用 户 在 调用 system ZAE IFS, 造成 system 执行 一 个 不 同 的 程序 。 
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大 多 数 UNIX 系统 提供 了 一 个 选项 以 进行 进程 会 计 〈process accounting) 处 理 。 启 用 该 选项 后 ， 每 
当 进 程 结束 时 内 核 就 写 一 个 会 计 记 录 。 典 型 的 会 计 记 录 包 含 总 量 较 小 的 二 进 制 数据 ， 一 般 包括 命令 名 、 
所 使 用 的 CPU 时 间 总 量 、 用 户 ID 和 组 太 、 启 动 时 间 等 。 本 节 将 较 详 细 地 说 明 这 种 会 计 记 录 ， 这 样 也 
使 我 们 得 到 了 一 个 再 次 观察 进程 的 机 会 ， 以 及 使 用 5.9 节 中 所 介绍 的 fread 函数 的 机 会 。 
任 一 标准 都 没有 对 进程 会 计 进行 过 说 明 。 于 是 ， 所 有 实现 都 有 令 人 厌烦 的 差别 。 例 如 ， 关 于 
IO 的 数量 ，Solaris 10 使 用 的 单位 是 字 节 ，FreeBSD 8.0 和 Mac OS X 10.6.8 使 用 的 单位 是 块 ， 但 
又 不 考虑 不 同 的 块 长 ， 这 使 得 该 计数 值 并 无 实际 效用 。Linux 3.2.0 则 完全 没有 保持 VO 统计 数 。 
每 种 实现 也 都 有 自己 的 一 套 管 理 命令 去 处 理 这 种 原始 的 会 计数 据 。 例 如 ，Solaris 提供 了 
runacct(lm) 和 acctcom(1), FreeBSD 则 提供 sa(8) 命 令 处 理 并 总 结 原始 会 计数 据 。 


一 个 至 今 没 有 说 明 的 函数 (acct) 启用 和 禁用 进程 会 计 。 唯 一 使 用 这 一 函数 的 是 accton(8) 
命令 〈 这 是 在 几 种 平台 上 都 类 似 的 少数 几 条 命令 中 的 一 条 )。 超 级 用 户 执行 一 个 带路 径 名 参数 的 
accton 命令 启用 会 计 处 理 。 会 计 记 录 写 到 指定 的 文件 中 ， 在 FreeBSD 和 Mac OS X 中 ， 该 文件 
通常 是 /var/account/acct; 在 Linux 中 ， 该 文件 是 /var/account/pacct; 在 Solaris 中 ， 
该 文件 是 /var/adm/pacct。 执 行 不 带 任何 参数 的 accton 命令 则 停止 会 计 处 理 。 

会 计 记 录 结 构 定义 在 头 文件 <sys/acct.h> 中 ,虽然 每 种 系统 的 实现 各 不 相同 ,但 会 计 记 录 
样式 基本 如 下 : 

typedef u short comp_t; /* 3-bit base 8 exponent; 13-bit fraction*/ 


struct acct 
{ 


char ac flag; /* flag (see Figure 8.26)*/ 

char ac stat; /* termination status(signal & core flag only)*/ 
/* (Solaris only)*/ 

uid t ac uid; /* real user ID*/ 

gid t ac gid; /* real group ID*/ 

dev t ac tty; /* controlling terminal*/ 

time t ac btime; /* starting calendar time*/ 


comp t ac utime; /* user CPU time*/ 


[269] 
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comp_t ac_stime; /* system CPU time*/ 

comp_t ac_etime; /* elapsed time*/ 

comp t ac mem; /* average memory usage*/ 

comp t ac io; /* bytes transferred (by read and write)*/ 
/* "blocks" on BSD systems*/ 

comp t ac rw; /* blocks read or written*/ 


/* (not present on BSD systems) */ 
char ac comm[8]; /* command name: [8] for Solaris,*/ 
/* [10] for Mac OS X, [16] for FreeBSD, and*/ 
/* [17] for Linux*/ 
}; 


在 大 多 数 的 平台 上 ， 时间 是 以 时 钟 滴答 数 记 录 的 ,但 FreeBSD 以 微 秒 进行 记录 的 。 ac flag 
成 员 记 录 了 进程 执行 期 间 的 某 些 事件 。 这 些 事件 见 图 8-26. 


fl — Linux Mac OS Solaris 
Bost ea 3.2.0 X 10.6.8 10 


| AFORK | | 进程 是 由 Fork 产生 的 ， 但 从 未 调用 exec | fork 产生 的 ， 但 从 未 调用 exec 
ASU 进程 使 用 超级 用 户 特 权 


RCORE 进程 转 储 core 
AXSIG 进程 由 一 个 信号 杀 死 
AEXPND 扩展 的 会 计 条 目 
ANVER 新 记录 格式 





图 8-26 会计 记录 中 的 ac_flag 值 

会 计 记录 所 需 的 各 个 数据 (各 CPU 时 间 、 传 输 的 字符 数 等 ) 都 由 内 核 保存 在 进程 表 中 ， 并 在 
一 个 新 进程 被 创建 时 初始 化 (如 fork 之 后 在 子 进 程 中 )。 进 程 终 止 时 写 一 个 会 计 记录 。 这 产生 两 
个 后 果 。 

第 一 ， 我 们 不 能 获取 永远 不 终止 的 进程 的 会 计 记 录 。 像 init 这 样 的 进程 在 系统 生命 周期 中 
_ 寺 在 运行 并 不 产生 会 计 记 录 。 这 也 同样 适合 于 内 核 守护 进程 ， 它 们 通常 不 会 终止 。 

第 二 ， 在 会 计 文 件 中 记录 的 顺序 对 应 于 进程 终止 的 顺序 ， 而 不 是 它们 启动 的 顺序 。 为 了 确定 
启动 顺序 ， 需 要 读 全 部 会 计 文件 ， 并 按 启动 日 历时 间 进 行 排序 。 这 不 是 一 种 很 完善 的 方法 ， 因 为 
日 历时 间 的 单位 是 秒 〈 见 1.10 节 )， 在 一 个 给 定 的 秒 中 可 能 启动 了 多 个 进程 。 而 墙 上 时 钟 时 间 的 
单位 是 时 钟 滴答 (通常 ， 每 秒 滴答 数 在 60 一 128)。 但 是 我 们 并 不 知道 进程 的 终止 时 间 ， 所 知道 的 
只 是 启动 时 间 和 终止 顺序 。 这 就 意味 着 ， 即 使 墙 上 时 钟 时 间 比 启动 时 间 要 精确 得 多 ， 仍 不 能 按照 
会 计 文件 中 的 数据 重 构 各 进程 的 精确 启动 顺序 。 

会 计 记 录 对 应 于 进程 而 不 是 程序 。 在 fork 之 后 ， 内 核 为 子 进程 初始 化 一 个 记录 ， 而 不 是 在 
一 个 新 程序 被 执行 时 初始 化 。 虽 然 exec 并 不 创建 一 个 新 的 会 计 记 录 ， 但 相应 记录 中 的 命令 名 改 
变 了 ，AFORK 标志 则 被 清除 。 这 意味 着 ， 如果 一 个 进程 顺序 执行 了 3 个 程序 CA exec B. B exec 
C， 最 后 是 C exit)， 只 会 写 一 个 会 计 记 录 。 在 该 记录 中 的 命令 名 对 应 于 程序 C， 但 CPU 时 间 是 
程序 A、B 和 C 之 和 。 


m SD 


为 了 得 到 某 些 会 计数 据 以 便 查 看 ， 我 们 按 图 8-27 编写 了 测试 程序 。 
测试 程序 的 源 代码 如 图 8-28 所 示 。 该 程序 调用 4 次 fork。 每 个 子 进程 做 不 同 的 事情 ， 然 后 
终止 。 
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sleep(2) Tor 第 一 个 子 进程 
sleep(4) Tor 第 二 个 子 进程 


exit(2) 





abort() 


Da 第 三 个 子 进程 






by 
sleep(8) Oey 第 四 个 子 进程 
exit(0) 
sleep(6) 
execl kill() 
/bin/dd 





图 8-27 会 计 处 理 实例 的 进程 结构 


#include "apue.h" 


int 
main (void) 
{ 
pid t pid; 


if ((pid = fork()) < 0) 
err sys("fork error"); 


else if (pid != O) ( /* parent */ 
sleep(2); 
exit (2); /* terminate with exit status 2 */ 


} 


if ((pid = fork()) < 0) 
err_sys("fork error"); 


else if (pid != 0) { /* first child */ 
sleep (4); 
abort (); /* terminate with core dump */ 


if ((pid = fork()) < 0) 
err sys("fork error"); 


else if (pid != 0) { /* second child */ 
execl("/bin/dd", "dd", "if-/etc/passwd", "of-/dev/null", NULL); 
exit (7); /* shouldn't get here */ 


if ((pid = fork()) < 0) 
err sys("fork error"); 


else if (pid != 0) { /* third child */ 
sleep (8); 
exit (0); /* normal exit */ 
) 
sleep(6); /* fourth child */ 
kill(getpid(), SIGKILL); /* terminate w/signal, no core dump */ 
exit(6); /* shouldn't get here */ 


图 8-28 产生 会 计数 据 的 程序 
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在 Solaris 上 运行 该 测试 程序 ， 然 后 用 图 8-29 中 的 程序 从 会 计 记 录 中 选择 一 些 字 段 并 打印 出 来 。 


#include "apue.h" 
#include <sys/acct.h> 


#if defined(BSD) /* different structure in FreeBSD */ 
#define acct acctv2 

#define ac flag ac trailer.ac flag 

#define FMT "$-*.*s e = %.0f, chars = %.0f, $c $c $c %c\n" 
#elif defined(HAS AC STAT) 

#define FMT "$-*.*s e = $6ld, chars = $71d, stat = $3u: $c $c $c %c\n" 
#felse 

#define FMT "£-*.*s e = %6ld, chars = $71d, $c %c $c %c\n" 
#endif 

#if defined (LINUX) 

#define acct acct_v3 /* different structure in Linux */ 
#endif 


#if !defined(HAS_ACORE) 
#define ACORE 0 

#endif 

#if !defined(HAS_AXSIG) 
#define AXSIG 0 

#endif 


#if !defined (BSD) 
static unsigned long 
compt2ulong(comp_t comptime) /* convert comp_t to unsigned long */ 
{ 
unsigned long val; 
int exp; 


val = comptime & Oxlfff;  /* 13-bit fraction */ 


exp = (comptime >> 13) & 7; /* 3-bit exponent (0-7) */ 
while (exp-- > 0) 
val *= 8; 


return (val); 


) 
dendif 


int 
main(int argc, char *argv[]) 
{ 
struct acct acdata; 
FILE *fp; 


if (argc != 2) 
err quit("usage: pracct filename"); 


if ((fp = fopen(argv[1], "r")) -- NULL) 
err sys("can't open $s", argv[1]); 
while (fread(&acdata, sizeof(acdata), 1, fp) -- 1) { 


printf(FMT, (int)sizeof(acdata.ac comm), 
(int) sizeof (acdata.ac_comm), acdata.ac comm, 
#if defined (BSD) 
acdata.ac etime, acdata.ac io, 
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#else 

compt2ulong(acdata.ac etime), compt2ulong(acdata.ac io), 
#endif 
#if defined(HAS AC STAT) 

(unsigned char) acdata.ac stat, 


#endif 
acdata.ac flag & ACORE ? 'D' : ' ', 
acdata.ac flag & AXSIG ? 'X' : ' ', 
acdata.ac flag & AFORK ? 'F' : ' ', 
acdata.ac flag & ASU g. S woo oyss 


} 
if (ferror (fp)) 

err_sys ("read error"); 
exit (0); 


829 打印 从 系统 会 计 文件 中 选 出 的 字段 
BSD 派生 的 平台 不 支持 ac_stat 成 员 ， 所 以 我 们 在 支持 该 成 员 的 平台 上 定义 了 
HAS_AC_STAT 常量 。 基 于 特性 而 非 平 台 定 义 的 符号 常量 使 代码 更 易 读 ， 也 使 我 们 更 容易 修改 程 
序 。 修 改 的 方法 是 对 编译 命令 增加 新 的 定义 。 替 代 方 法 可 以 是 使 用 : 


#if !defined(BSD) && !defined (MACOS) 


但 是 ， 当 将 应 用 移植 到 其 他 平台 上 时 ， 这 种 方法 会 带 来 很 大 的 不 便 。 

我 们 定义 了 类 似 的 常量 以 判断 该 平台 是 否 支 持 ACORE 和 AXSIG 会 计 标 志 。 我 们 不 能 直接 使 
用 这 两 个 标志 符号 ， 其 原因 是 ， 在 Linux 中 ， 它 们 被 定义 为 enum 类 型 值 ， 而 在 #ifdef 表达 式 
中 不 能 使 用 此 种 类 型 值 。 

为 了 进行 测试 ， 执 行 下 列 操作 步 又 。 

CD 成 为 超级 用 户 ， 用 accton 命令 启用 会 计 处 理 。 注 意 ， 当 此 命令 结束 时 ， 会 计 处 理 已 经 
启用 ， 因 此 在 会 计 文件 中 的 第 一 个 记录 应 来 自 这 一 命令 。 

(2) 终止 超级 用 户 shell, 运行 图 8-28 程序 。 这 会 追加 6 个 记录 到 会 计 文件 中 (超级 用 户 shell 

个 、 父 进程 一 个 、4 个 子 进程 各 一 个 )。 

在 第 二 个 子 进程 中 ，execl 并 不 创建 一 个 新 进程 ， 所 以 对 第 二 个 进程 只 有 一 个 会 计 记录 。 

(3) 成 为 超级 用 户 ， 停 止 会 计 处 理 。 因 为 在 accton 命令 终止 时 已 经 停止 会 计 处 理 ， 所 以 不 
会 在 会 计 文 件 中 增加 一 个 记录 。 

(4) 运行 图 8-29 程序 ， 从 会 计 文 件 中 选 出 字段 并 打印 。 

第 4 步 的 输出 如 下 面 所 示 。 在 每 一 行 中 都 对 进程 追加 了 说 明 ， 以 便 后 面 讨论 。 


accton e = 1, chars = 336, stat = 0: S 

sh e = 1550, chars = 20168, stat - 0: S 

dd e- 2, chars = 1585, stat = 0: 第 二 个 子 进 程 
a.out e= 202, chars = 0, stat = 0: 父 进程 
a.out e= 420, chars = 0, stat = 134: F 第 一 个 子 进程 
a.out e 丢 600, chars - 0, stat = 9: F 第 四 个 子 进程 
a.out e= 801, chars = 0, stat = 0: F 第 三 个 子 进程 


墙 上 时 钟 时 间 值 的 单位 是 每 秒 滴 答 数 。 从 图 2-15 中 可 见 , 本 系统 的 每 秒 滴答 数 是 100。 例 如 ， 
在 父 进程 中 的 sleep(2) 对 应 于 墙 上 时 钟 时 间 202 个 时 钟 滴答 。 对 于 第 一 个 子 进程 ，sleep(4) 变 
成 420 时 钟 滴答 。 注 意 ， 一 个 进程 休眠 的 时 间 总 量 并 不 精确 。( 第 10 章 将 返回 到 sleep 函数 。) 
调用 fork 和 exit 也 需要 一 些 时 间 。 


220 第 8 章 进程 控制 


注意 , ac stat 成 员 并 不 是 进程 的 真正 终止 状态 。 它 只 是 8.6 节 中 讨论 的 终止 状态 的 一 部 分 。 
如 果 进 程 异常 终止 ， 则 此 字 节 包含 的 信息 只 是 core 标志 位 《〈 一 般 是 最 高 位 ) 以 及 信和 号 编号 数 〈 一 

般 是 低 7 位 )。 如 果 进 程 正常 终止 ， 则 从 会 计 文 件 不 能 得 到 进程 的 退出 Cexit) 状态 。 对 于 第 一 
个 子 进程 , 此 值 是 128+6. 128 是 core 标志 位 , 6 是 此 系统 信号 SIGABRT 的 值 ( 它 是 由 调用 abort 
产生 的 )。 第 四 个 子 进程 的 值 是 9， 它 对 应 于 SIGKILL 的 值 。 从 会 计 文件 的 数据 中 不 能 分 辨 出 ， 
父 进程 在 退出 时 所 用 的 参数 值 是 2， 第 三 个 子 进 程 退 出 时 所 用 的 参数 值 是 0。 

dd 进程 将 文件 /etc/Passwd 复制 到 第 二 个 子 进程 中 ， 该 文件 的 长 度 是 777 字 节 。 而 IO F 
符 数 是 此 值 的 2 倍 ， 其 原因 是 读 了 777 字 节 ， 然 后 又 写 了 777 字 节 。 即 使 输出 到 空 设 备 ， 但 仍 对 
VO 字符 数 进行 计算 。add 命令 还 有 31 个 附加 字 节 ， 用 于 报告 读 写字 节 数 的 摘要 信息 ， 该 摘要 信 
息 也 会 在 stdout 上 打印 输出 。 

ac flag 值 与 我 们 所 预料 的 相同 。 除 调用 execl 的 第 二 个 子 进 程 以 外 ， 其 他 子 进程 都 设置 
T F 标志 。 父 进程 没有 设置 F 标志 ， 其 原因 是 执行 父 进程 的 交互 式 shell 调用 fork， 然 后 执行 
a.out 文件 。 第 一 个 子 进程 调用 abort, abort 产生 信和 号 SIGABRT， 产 生 了 core 转 储 。 该 进程 
的 X 标 志和 D 标志 都 没有 打开 ， 因 为 Solaris 不 支持 它们 ; 相关 信息 可 从 ac stat 字段 导出 。 第 
四 个 子 进程 也 因 信 和 号 而 终止 ， 但 是 SIGKILL 信号 并 不 产生 core 转 储 ， 它 只 是 终止 该 进程 。 

最 后 要 说 明 的 是 : 第 一 个 子 进程 的 IO 字符 数 为 0， 但 是 该 进程 产生 了 一 个 core 文件 。 其 
原因 是 写 core 文件 所 需 的 VO 并 不 由 该 进程 负责 。 a 


8.15 用户 标识 


任 一 进程 都 可 以 得 到 其 实际 用 户 ID 和 有 效用 户 ID 及 组 ID. 但 是 , 我 们 有 时 希望 找到 运行 该 
程序 用 户 的 登录 名 。 我 们 可 以 调用 getpwuid(getuid() ) ， 但 是 如 果 一 个 用 户 有 多 个 登录 名 ， 
这 些 登 录 名 又 对 应 着 同一 个 用 户 ID， 又 将 如 何 呢 ? 〔〈 一 个 人 在 口令 文件 中 可 以 有 多 个 登录 项 ， 它 
们 的 用 户 ID 相同 ， 但 登录 shell 不 同 。) 系统 通常 记录 用 户 登 录 时 使 用 的 名 字 〈 见 6.8 节 )， 用 
getlogin 函数 可 以 获取 此 登录 名 。 


#include <unistd.h> 


char *getlogin (void); 





返回 值 : 若 成 功 ， 返 回 指向 登录 名 字符 串 的 指针 ， 若 出 错 ， 返 回 NULL 


如 果 调 用 此 函数 的 进程 没有 连接 到 用 户 登 录 时 所 用 的 终端 ， 则 函数 会 失败 。 通 常 称 这 些 进 程 
为 守护 进程 (daemon)， 第 13 章 将 对 这 种 进程 专门 进行 讨论 。 
给 出 了 登录 名 , 就 可 用 getpwnam 在 口令 文件 中 查找 用 户 的 相应 记录 , 从 而 确定 其 登录 shell 等 。 
为 了 找到 登录 名 , UNIX 系统 在 历史 上 一 直 是 调用 ttyname 函数 ( 见 18.9 节 ), 然后 在 utmp 
文件 ( 见 6.8 节 ) 中 找 匹 配 项 。FreeBSD 和 Mac OS X 将 登录 名 存放 在 与 进程 表 项 相关 联 的 会 话 结 
构 中 ， 并 提供 系统 调用 获取 该 登录 名 。 
System V 提供 cuserid 函数 返回 登录 名 。 此 函数 先 调用 getlogin 函数 ， 如 果 失 败 则 再 调 
用 getpwuid(getuid()). IEEE 标准 1003.1-1988 说 明了 cuserid，, 但 是 它 以 有 效用 户 ID 而 
不 是 实际 用 户 ID 来 调用 。POSIX.1 的 1990 版 本 删除 了 cuserid 函数 。 
环境 变量 LOGNAME 通常 由 1ogin(1) 以 用 户 的 登录 名 对 其 赋 初 值 ,并 由 登录 shell 继承 。 但 是 ， 
用 户 可 以 修改 环境 变量 ， 所 以 不 能 使 用 LOGNAME 来 验证 用 户 ， 而 应 当 使 用 getlogin BK. 
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UNIX 系统 历史 上 对 进程 提供 的 只 是 基于 调度 优先 级 的 粗 粒度 的 控制 。 调 度 策略 和 调度 优先 
级 是 由 内 核 确定 的 。 进程 可 以 通过 调整 nice 值 选择 以 更 低 优 先 级 运行 (通过 调整 nice 值 降低 它 对 
CPU 的 占有 ， 因 此 该 进程 是 “友好 的 ”)。 只 有 特权 进程 允许 提高 调度 权限 。 

POSIX 实时 扩展 增加 了 在 多 个 调度 类 别 中 选择 的 接口 以 进一步 细 调 行为 。 我 们 这 里 只 讨论 用 
于 调整 nice 值 的 接口 ， 这 些 包 括 在 POSIX.1 的 XSI 扩展 选项 中 。 关 于 实时 调度 扩展 更 多 的 信息 ， 
可 参考 Gallmeister[1995]。 

Single UNIX Specification 中 nice 值 的 范围 在 0~ (2*NZERO) -1 之 间 ， 有 些 实现 支持 0 一 
2*NZERO. nice 值 越 小 ,优先 级 越 高 。 虽 然 这 看 起 来 有 点 倒退 ,但 实际 上 是 有 道理 的 : 你 越 友好 ， 
你 的 调度 优先 级 就 越 低 。NZERO 是 系统 默认 的 nice 值 。 

注意 ， 定 义 NZERO 的 头 文件 因 系统 而 异 。 除 了 头 文件 以 外 ，Linux 3.2.0 可 以 通过 非 标 准 的 
sysconf 参数 ( SC NZERO) 来 访问 NZERO 的 值 。 

进程 可 以 通过 nice 函数 获取 或 更 改 它 的 nice 值 。 使 用 这 个 函数 ， 进 程 只 能 影响 自己 的 nice 
值 ， 不 能 影响 任何 其 他 进程 的 nice 值 。 


#include <unistd.h> 


int nice(int incr); 





返回 值 ， 若 成 功 ， 返 回 新 的 nice 值 NZERO; 若 出 错 ， 返 回 -1 | |276 
incr 参数 被 增加 到 调用 进程 的 nice 值 上 。 如 果 incr 太 大 ， 系 统 直 接 把 它 降 到 最 大 合法 值 ， 不 给 出 
提示 。 类 似 地 ， 如 果 inr 太 小 ， 系 统 也 会 无 声息 地 把 它 提高 到 最 小 合法 值 。 由 于 -1 是 合法 的 成 功 返 回 
值 ， 在 调用 nice 函数 之 前 需要 清楚 errno, Æ nice 函数 返回 -1 时 ， 需 要 检查 它 的 值 。 如 果 nice 
调用 成 功 ， 并 且 返 回 值 为 -1， 那 么 errno 仍然 为 0。 如果 errno 不 为 0， 说 明 nice 调用 失败 。 
getpriority AAT WR nice 函数 那样 用 于 获取 进程 的 nice 值 ， 但 是 getpriority 还 
可 以 获取 一 组 相关 进程 的 nice 值 。 


#include <sys/resource.h> 





int getpriority(int which, id_t who); 


返回 值 : 若 成 功 ， 返 回 -NZERO~NZERO-1 之 间 的 nice 值 ， 若 出 错 ， 返 回 -1 
which 参数 可 以 取 以 下 三 个 值 之 一 : PRIO PROCESS 表示 进程 ，PRIO_PGRP 表示 进程 组 ， 
PRIO USER 表示 用 户 ID. which 参数 控制 who 参数 是 如 何 解释 的 ，wpo 参数 选择 感 兴趣 的 一 个 
或 多 个 进程 。 如 果 who 参数 为 0， 表 示 调 用 进程 、 进 程 组 或 者 用 户 ( 取 决 于 which 参数 的 值 )。 当 
which 设 为 PRIO USER 并 且 who 为 0 时 ， 使 用 调用 进程 的 实际 用 户 ID. WR which 参数 作用 于 
多 个 进程 ， 则 返回 所 有 作用 进程 中 优先 级 最 高 的 〈 最 小 的 nice 值 )。 
setpriority 函数 可 用 于 为 进程 、 进 程 组 和 属于 特定 用 户 ID 的 所 有 进程 设置 优先 级 。 


#include <sys/resource.h> 
int setpriority(int which, id t who, int value); 
返回 值 ， 若 成 功 ， 返 回 0;， 若 出 错 ， 返 回 -1 


BAX which ll who 与 getpriority 函数 中 相同 。value 增加 到 NZERO E, 然后 变 为 新 的 nice fH 
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nice 系统 调用 起 源 于 早期 Research UNIX 系统 的 PDP-11 版 本 。getpriority 和 
setpriority %4 Ñ f 4.2BSD。 


Single UNIX Specification 没有 对 在 fork 之 后 子 进 程 是 否 继承 nice 值 制定 规则 , 而 是 留 给 具 
体 实现 自行 决定 。 但 是 遵循 XSI 的 系统 要 求 进程 调用 exec 后 保留 nice 值 。 


在 FreeBSD 8.0, Linux 3.2.0, MacOS X 10.6.8 以 及 Solaris 10 中 ， 子 进程 从 父 进 程 中 继承 


| nice 值 。 


上 实例 


图 8-30 的 程序 度量 了 调整 进程 nice 值 的 效果 。 两 个 进程 并 行 运行 ， 各 自 增 加 自己 的 计数 器 。 
父 进程 使 用 了 默认 的 nice 值 ， 子 进程 以 可 选 命令 参数 指定 的 调整 后 的 nice 值 运行 。 运 行 10 s 后 ， 
两 个 进程 都 打印 各 自 的 计数 值 并 终止 。 通 过 比较 不 同 nice 值 的 进程 的 计数 值 的 差异 ,我 们 可 以 了 

解 nice 值 时 如 何 影响 进程 调度 的 。 


#include "apue.h" 
#include <errno.h> 
#include <sys/time.h> 


#if defined (MACOS) 
#include <sys/syslimits.h> 
#elif defined (SOLARIS) 
#include <limits.h> 

#elif defined (BSD) 
#include <sys/param.h> 
#tendif 


unsigned long long count; 
struct timeval end; 


void 
checktime(char *str) 
{ 


struct timeval tv; 


gettimeofday(&tv, NULL); 

if (tv.tv sec >= end.tv sec && tv.tv usec >= end.tv usec) { 
printf("%s count = %lld\n", str, count); 
exit(0); 


} 


int 
main(int argc, char *argv[]) 
{ 

pid t pid; 


char *ss 
int nzero, ret; 
int adj = 0; 


setbuf(stdout, NULL); 
#if defined (NZERO) 


nzero = NZERO; 
#elif defined (_SC_NZERO) 
nzero = sysconf( SC NZERO); 
#else 
#error NZERO undefined 
#endif 
printf ("NZERO = %d\n", nzero); 
if (argc == 2) 
adj = strtol(argv[1], NULL, 10); 
gettimeofday(&end, NULL); 
end.tv_sec += 10; /* run for 10 seconds */ 


if ((pid = fork()) < 0) { 
err_sys("fork failed"); 
} else if (pid == 0) { /* child */ 
s = "child"; 
printf("current nice value in child is %d, adjusting by %d\n", 
nice(0)+nzero, adj); 
errno = 0; 
if ((ret = nice(adj)) == -1 && errno != 0) 
err_sys("child set scheduling priority"); 
printf("now child nice value is %d\n", ret+nzero) ; 
} else { /* parent */ 
s = "parent"; 
printf ("current nice value in parent is %d\n", nice(0)+nzero); 
} 
for(;;) { 
if (++count == 0) 
err_quit("%s counter wrap", s); 
checktime (s); 


图 8-30 ”更改 nice 值 的 效果 
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执行 该 程序 两 次 : 一 次 用 默认 的 nice 值 ， 另 一 次 用 最 高 有 效 nice 值 〈 最 低调 度 优 先 级 )。 程 
序 运行 在 单 处 理 器 Linux 系统 上 ， 以 显示 调度 程序 如 何在 不 同 nice 值 的 进程 间 进 行 CPU 的 共享 。 
否则 , 对 于 有 空闲 资源 的 系统 ， 如 多 处 理 器 系统 (或 多 核 CPU)， 两 个 进程 可 能 无 需 共享 CPU GS 


行 在 不 同 的 处 理 器 上 )， 就 无 法 看 出 具有 不 同 nice 值 的 两 个 进程 的 差异 。 


$ ./a.out 

NZERO = 20 

current nice value in parent is 20 

current nice value in child is 20, adjusting by 0 
now child nice value is 20 

child count - 1859362 

parent count = 1845338 

$ ./a.out 20 

NZERO - 20 

current nice value in parent is 20 

current nice value in child is 20, adjusting by 20 
now child nice value is 39 

parent count - 3595709 

child count - 52111 


当 两 个 进程 的 nice 值 相同 时 ， 父 进程 占用 50.2948] CPU， 子 进程 占用 49.8% 的 CPU。 可 以 看 
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到 ， 两 个 进程 被 有 效 地 进行 了 平等 对 待 。 百 分 比 并 不 完全 相同 ， 是 因为 进程 调度 并 不 精确 ， 而 且 
279) 子 进程 和 父 进程 在 计算 结束 时 间 和 处 理 循环 开始 时 间 之 间 执 行 了 不 同 数量 的 处 理 。 
相 比 之 下 , 当 子 进程 有 最 高 可 能 nice 值 (最 低 优 先 级 ) 时 , 我 们 看 到 父 进程 占用 98.5% 的 CPU, 
而 子 进程 只 占用 1.5% 的 CPU。 这 些 值 取决 于 进程 调度 程序 如 何 使 用 nice 值 ， 因 此 不 同 的 UNIX 
系统 会 产生 不 同 的 CPU 占用 比 。 e 


8.17 ”进程 时 间 


在 1.10 节 中 说 明了 我 们 可 以 度量 的 3 个 时 间 : 墙 上 时 钟 时 间 、 用 户 CPU 时 间 和 系统 CPU 时 
间 。 任 一 进程 都 可 调用 times 函数 获得 它 自己 以 及 已 终止 子 进程 的 上 述 值 。 


#include <sys/times.h> 


clock_t times (struct tms *buf)); 
返回 值 : 若 成 功 ， 返 回流 逝 的 墙 上 时 钟 时 间 〈 以 时 钟 滴答 数 为 单位 ); 若 出 错 ， 返 回 -1 


此 函数 填写 由 buf 指 向 的 tms 结构 ， 该 结构 定义 如 下 : 





struct tms { 
clock_t tms_utime; /* user CPU time */ 
clock_t tms_stime; /* system CPU time */ 
clock_t tms_cutime; /* user CPU time,terminated children */ 
clock_t tms_cstime; /* system CPU time,terminated children */ 


}; 

注意 ， 此 结构 没有 包含 墙 上 时 钟 时 间 。times 函数 返回 墙 上 时 钟 时 间作 为 其 函数 值 。 此 值 是 
相对 于 过 去 的 某 一 时 刻度 量 的 ， 所 以 不 能 用 其 绝对 值 而 必须 使 用 其 相对 值 。 例 如 ， 调 用 times, 
保存 其 返回 值 。 在 以 后 某 个 时 间 再 次 调用 times， 从 新 返回 的 值 中 减 去 以 前 返回 的 值 ， 此 差 值 就 
是 墙 上 时 钟 时 间 。( 一 个 长 期 运行 的 进程 可 能 其 墙 上 时 钟 时 间 会 游 出， 当然 这 种 可 能 性 极 小 ， 见 
习题 1.5)。 

该 结构 中 两 个 针对 子 进程 的 字段 包含 了 此 进程 用 本 章 开 始 部 分 的 wait 函数 族 已 等 待 到 的 各 
子 进程 的 值 。 

所 有 由 此 函数 返回 的 clock t 值 都 用 _SC_CLK_TCK (由 sysconf 函数 返回 的 每 秒 时 钟 滴 
答 数 ， 见 2.5.4 节 ) 转换 成 秒 数 。 


大 多 数 实现 提供 了 getrusage(2) 函 数 ， 该 函数 返回 CPU 时 间 以 及 指示 资源 使 用 情况 的 另外 
14 个 值 。 它 起 源 于 BSD 系统 ， 所 以 BSD 派生 的 实现 与 其 他 实现 比较 ， 支 持 的 字段 要 多 一 些 。 


和 实例 
图 8-31 中 的 程序 将 每 个 命令 行 参数 作为 shell 命令 串 执行 ， 对 每 个 命令 计时 ， 并 打印 从 tms 
Tao) 结构 取得 的 值 。 


#include "apue.h" 
#include <sys/times.h> 








static void pr_times(clock_t, struct tms *, struct tms *); 
static void do_cmd(char *); 





int 


main(int argc, char *argv[]) 


{ 


int 


i; 


setbuf (stdout, NULL); 


for (i = 1; i < argc; i++) 
do cmd(argv[i]); /* once for each command-line arg */ 
exit(0); 


static void 


do cmd(char *cmd) 


1 


struct tms tmsstart, tmsend; 
clock t start, end; 


int 


status; 


printf ("\ncommand: %s\n", cmd); 


if ((start = times(&tmsstart)) -- -1) yx 
err_sys ("times error"); 

if ((status = system(cmd)) < 0) /* 
err_sys("system() error"); 

if ((end = times(&tmsend)) == -1) 


err_sys("times error"); 


pr times(end-start, &tmsstart, &tmsend); 


pr exit(status); 


static void 
pr times(clock t real, struct tms *tmsstart, struct tms *tmsend) 


( 


static long 


if 


(clktck == 0) 


clktck = 0; 


/* execute and time the "cmd" */ 


starting values */ 


execute command */ 


if ((clktck = sysconf(_SC_CLK_TCK)) < 0) 


err_sys("sysconf error"); 


printf(" real: %7.2f\n", real / (double) 
printf(" user: %7.2f\n", 
(tmsend-»tms utime - tmsstart-»tms utime) 
printf(" sys: %7.2£\n", 
(tmsend->tms_stime - tmsstart-»tms stime) 
printf(" child user: $5$7.2fWi", 
(tmsend->tms_cutime - tmsstart->tms_cutime) / (double) 
printf(" child sys: E7:2fYn"; 
(tmsend->tms_cstime - tmsstart-^tms cstime) / (double) 


clktck); 


/ 


/ 


/* ending values */ 


/* fetch clock ticks per second first time */ 


(double) clktck); 


(double) clktck); 


图 8-31 计时 并 执行 所 有 命令 行 参数 


运行 此 程序 可 以 得 到 : 


clktck); 


clktck); 
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$ ./a.out "sleep 5" "date" "man bash >/dev/null" 
command: sleep 5 


real: 5.01 
user: 0.00 
sys: 0.00 
child user: 0.00 
child sys: 0.00 
normal termination, exit status = 0 


command: date 
Sun Feb 26 18:39:23 EST 2012 
real: 0.00 
user: 0.00 
sys: 0.00 
child user: 0.00 
child sys: 0.00 
normal termination, exit status = 0 


command: man bash >/dev/null 
real: 1.46 
user: 0.00 
sys: 0.00 
child user: Lease 
child sys: 0.07 
normal termination, exit status = 0 


在 前 两 个 命令 中 , 命令 执行 时 间 足 够 快 避免 了 以 可 报告 的 精度 记录 CPU 时 间 。 但 在 第 3 个 命 
令 中 ， 运 行 了 一 个 处 理 时 间 足 够 长 的 命令 来 表明 所 有 的 CPU 时 间 都 出 现在 子 进程 中 ， 而 shell 和 
命令 正 是 在 子 进程 中 执行 的 。 E 


8.18 小结 


对 在 UNIX 环境 中 的 高 级 编程 而 言 ， 完 整地 了 解 UNIX 的 进程 控制 是 非常 重要 的 。 其 中 必须 
熟练 掌握 的 只 有 几 个 函数 一 fork、exec 系列 、 exit. wait 和 waitpidq。 很 多 应 用 程序 都 
使 用 这 些 简单 的 函数 。fork 函数 也 给 了 我 们 一 个 了 解 竞争 条 件 的 机 会 。 

本 章 说 明了 system 函数 和 进程 会 计 ， 这 也 使 我 们 能 进一步 了 解 所 有 这 些 进程 控制 函数 。 本 

章 还 说 明了 exec 函数 的 另 一 种 变 体 : 解释 器 文件 及 它们 的 工作 方式 。 对 各 种 不 同 的 用 户 ID 和 组 
ID (实际 、 有 效 和 保存 的 ) 的 理解 ， 对 编写 安全 的 设置 用 户 ID 程序 是 至 关 重 要 的 。 

在 了 解 进程 和 子 进程 的 基础 上 ， 下 一 章 将 进一步 说 明 进程 和 其 他 进程 的 关系 一 一 会 话 和 作业 
控制 。 第 10 章 将 说 明 信 号 机 制 并 以 此 结束 对 进程 的 讨论 。 


习题 
81 在 图 8-3 程序 中 , 如果 用 exit 调用 代替 exit 调用 ,那么 可 能 会 使 标准 输出 关闭 ,使 printf 


返回 -1。 修 改 该 程序 以 验证 在 你 所 使 用 的 系统 上 是 否 会 产生 此 种 结果 。 如 果 并 非 如 此 ， 你 怎 
样 处 理 才 能 得 到 类 似 结果 呢 ? 


8.2 


8.3 


8.4 


8.5 


8.6 
8.7 
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回忆 图 7-6 中 典型 的 存储 空间 布局 。 由 于 对 应 于 每 个 函数 调用 的 栈 帧 通常 存储 在 栈 中 ， 并 且 
由 于 调用 vfork 后 ， 子 进程 运行 在 父 进程 的 地 址 空间 中 ， 如 果 不 是 在 main 函数 中 而 是 在 
另 一 个 函数 中 调用 vfork, 此 后 子 进程 又 从 该 函数 返回 , 将 会 发 生 什么 ? 请 编写 一 段 测试 程 
序 对 此 进行 验证 ， 并 且 画 图 说 明 发 生 了 什么 。 . 

重 写 图 8-6 中 的 程序 ， 把 wait 换 成 waitid。 不 调用 pr_exit， 而 从 siginfo 结构 中 确 
定 等 价 的 信息 。 

当 用 $./a.out 执行 图 8-13 中 的 程序 一 次 时 ， 其 输出 是 正确 的 。 但 是 若 将 该 程序 按 下 列 方 
式 执行 多 次 ， 则 其 输出 不 正确 。 

$ ./a.out ; a.out ;./a.out 

output from parent 

ooutput from parent 

ouotuptut from child 

put from parent 


output from child 
utput from child 


原因 是 什么 ? 怎样 才能 更 正 此 类 错误 ?如果 使 子 进程 首先 输出 ， 还 会 发 生 此 问题 吗 ? 

在 图 8-20 所 示 的 程序 中 ， 调 用 execl， 指 定 pathname 为 解释 器 文件 。 如 果 将 其 改 为 调用 
execlp, #8 testinterp 的 filename， 并 且 如 果 目 录 /home/sar/bin 是 路 径 前 级 ， 则 
运行 该 程序 时 ，argv[2] 的 打印 输出 是 什么 ? 

编写 一 段 程序 创建 一 个 僵 死 进程 ， 然 后 调用 system 执行 ps(1) 命 令 以 验证 该 进程 是 僵 死 进程 。 
8.10 节 中 提 及 POSIX.1 要 求 在 exec 时 关闭 打开 目录 流 。 按 下 列 方法 对 此 进行 验证 : 对 根 目 
录 调 用 opendir， 查 看 在 你 系统 上 实现 的 DIR 结构 ， 然 后 打印 执行 时 关闭 标志 。 接 着 打开 
同一 目录 读 并 打印 执行 时 关闭 标志 。 





9.1 引言 


在 上 一 章 我 们 已 了 解 到 进程 之 间 具 有 关系 。 首 先 ， 每 个 进程 有 一 个 父 进 程 〈 初 始 的 内 核 级 进 
程 通常 是 自己 的 父 进程 )。 当 子 进程 终止 时 ， 父 进程 得 到 通知 并 能 取得 子 进程 的 退出 状态 。 在 8.6 
节 说 明 waitpid 函数 时 ， 我 们 也 提 到 了 进程 组 ， 以 及 如 何等 待 进程 组 中 的 任意 一 个 进程 终止 。 

本 章 将 更 详细 地 说 明 进 程 组 以 及 POSIX.1 引入 的 会 话 的 概念 。 还 将 介绍 登录 shell (登录 时 所 
调用 的 ) 和 所 有 从 登录 shell 启动 的 进程 之 间 的 关系 。 

在 说 明 这 些 关 系 时 不 可 能 不 谈 及 信号 ， 而 讨论 信号 时 又 需要 很 多 本 章 介 绍 的 概念 。 如 果 你 不 
熟悉 UNIX 系统 信号 机 制 ， 则 可 能 先 要 浏览 一 下 第 10 章 。 


9.2 终端 登录 


先 说 明 当 我 们 登录 到 UNIX 系统 时 所 执行 的 各 个 程序 。 在 早期 的 UNIX 系统 (如 VD 中 ， 用 户 用 
吨 终 端 (用 硬 连接 连 到 主机 ) 进 行 登录 。 终端 或 者 是 本 地 的 (直接 连接 ) 或 者 是 远程 的 (通过 调制 解 调 


器 连接 )。 在 这 两 种 情况 下 ， 登 录 都 经 由 内 核 中 的 终端 设备 驱动 程序 。 例 如 , 在 PDP-11 上 常用 的 设备 是 


DH-11 和 DZ-11。 因 为 连 到 主机 上 的 终端 设备 数 是 固定 的 ， 所 以 同时 的 登录 数 也 就 有 了 已 知 的 上 限 。 

随 着 位 映射 图 形 终端 的 出 现 ， 开 发 出 了 窗口 系统 ， 它 向 用 户 提 供 了 与 主机 系统 进行 交互 的 新 
方式 。 创 建 终 端 窗口 的 应 用 也 被 开发 出 来 ， 它 仿真 了 基于 字符 的 终端 ， 使 得 用 户 可 以 用 熟悉 的 方 
式 〈 即 通过 shell 命令 行 ) 与 主机 进行 交互 。 

现今 ， 某 些 平台 允许 用 户 在 登录 后 启动 一 个 窗口 系统 ， 而 男 一 些 平台 则 自动 为 用 户 启动 窗口 
系统 。 在 后 面 一 种 情况 中 ， 用 户 可 能 仍然 需要 登录 ， 这 取决 于 窗口 系统 是 如 何 配置 的 〈 某 些 窗口 
系统 可 被 配置 成 自动 为 用 户 登录 )。 

我 们 现在 描述 的 过 程 用 于 经 由 终端 登录 至 UNIX 系统 。 该 过 程 几乎 与 所 使 用 的 终端 类 型 无 关 , 所 
使 用 的 终端 可 以 是 基于 字符 的 终端 、 仿 真 基于 字符 终端 的 图 形 终端 ， 或 者 运行 窗口 系统 的 图 形 终端 。 

1. BSD 终端 登录 

在 过 去 35 EH, BSD 终端 登录 过 程 并 没有 多 少 改 变 。 系 统管 理 者 创建 通常 名 为 /etc/ttys 
的 文件 ， 其 中 ， 每 个 终端 设备 都 有 一 行 ， 每 一 行 说 明 设 备 名 和 传 到 getty 程序 的 参数 。 例 如 ， 其 
中 一 个 参数 说 明了 终端 的 波 特 率 等 。 当 系统 自 举 时 ， 内 核 创 建 进程 ID 为 1 的 进程 ， 也 就 是 init 
进程 。init 进程 使 系统 进入 多 用 户 模 式 。init 读 取 文 件 /etc/ttys， 对 每 一 个 允许 登录 的 终端 
设备 ，init 调用 一 次 fork， 它 所 生成 的 子 进程 则 exec getty 程序 。 这 种 情况 示 于 图 9-1 n. 
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图 9-1 中 所 有 进程 的 实际 用 户 ID 和 有 效用 户 ID 都 是 0 (也 就 是 说 ， 它 们 都 具有 超级 用 户 特 
BO. init 以 空 环境 exec getty 程序 。 

getty 对 终端 设备 调用 open 函数 ， 以 读 、 写 方式 将 终端 打开 。 如 果 设 备 是 调制 解 调 器 ， 则 
open 可 能 会 在 设备 驱动 程序 中 滞留 ， 直 到 用 户 拨号 调制 解 调 器 ， 并 且 线 路 被 接 通 。 一 旦 设备 被 打 
开 ， 则 文件 描述 符 0、1、2 就 被 设置 到 该 设备 。 然 后 getty MH “login: ”之 类 的 信息 ， 并 等 
待 用 户 键入 用 户 名 。 如 果 终 端 支持 多 种 速度 ， 则 getty 可 以 测试 特殊 字符 以 便 适 当地 更 改 终端 速 
度 ( 波 特 率 )。 关 于 getty 程序 以 及 有 关 数 据 文 件 (gettytab) 的 细节 ,请 参阅 UNIX 系统 手册 。 

当 用 户 键入 了 用 户 名 后 ，getty 的 工作 就 完成 了 。 然 后 它 以 类 似 于 下 列 的 方式 调用 login 程序 : 


execle("/bin/login", "login", "-p", username, (char *)0, envp); 


CE gettytab 文件 中 可 能 会 有 一 些 选 项 使 其 调用 其 他 程序 ， 但 系统 默认 是 login fF). init 
以 一 个 空 环境 调用 getty. getty 以 终端 名 (如 TERM=foo， 其 中 终端 foo 的 类 型 取 自 gettytab 
文件 ) 和 在 gettytab 中 说 明 的 环境 字符 串 为 login 创建 一 个 环境 (envp BAO. -p 标志 通知 
login 保留 传递 给 它 的 环境 ， 也 可 将 其 他 环境 字符 串 加 到 该 环境 中 ， 但 是 不 要 替换 它 。 图 9-2 显 
ARS Login 刚 被 调用 后 这 些 进程 的 状态 。 























一 进程 D1 yar /etc/ttys 
init 每 个 终端 执行 一 次 fork 
进程 ID1 i. 创建 空 环 境 
init x fork ^a, 

. ENT iub 
init 
每 个 终端 执行 
一 次 fork exec 
J TR 
(文件 描述 符 0, 1, 2); 
pegs 读 用 户 名 
^ 每 个 子 进程 axe 初始 环境 集 
J exec getty | 
login 
图 9-1 为 允许 终端 登录 ，init 调用 的 进程 图 9-2 login 调用 后 进程 的 状态 


因为 最 初 的 init 进程 具有 超级 用 户 特权 ， 所 以 图 9-2 中 的 所 有 进程 都 有 超级 用 户 特权 。 图 
9-2 中 底部 3 个 进程 的 进程 ID 相同 ， 因 为 进程 ID 不 会 因 执行 exec 而 改变 。 并 且 ， 除 了 最 初 的 
init 进程 ， 所 有 进程 的 父 进程 ID 均 为 1。 

login 能 处 理 多 项 工作 。 因 为 它 得 到 了 用 户 名 ， 所 以 能 调用 getpwnam 取得 相应 用 户 的 口 
令 文件 登录 项 。 然 后 调用 getpass(3) 以 显示 提示 “Password: ”， 接 着 读 用 户 键入 的 口令 〈 自 
然 ， 禁 止 回 显 用 户 键入 的 口令 )。 它 调用 crypt(3) 将 用 户 键入 的 口令 加 密 ， 并 与 该 用 户 在 阴影 口 
令 文件 中 登录 项 的 pw_passwd 字段 相 比 较 。 如 果 用 户 几 次 键入 的 口令 都 无 效 ， 则 login 以 参数 
1 调用 exit 表示 登录 过 程 失败 。 父 进程 (init) 了 解 到 子 进程 的 终止 情况 后 , 将 再 次 调用 fork, 
其 后 又 执行 了 getty， 对 此 终端 重复 上 述 过 程 。 

这 是 UNIX 系统 传统 的 用 户 身 份 验 证 过 程 。 现 代 UNIX 系统 已 发 展 到 支持 多 个 身份 验证 过 程 。 
例如 ，FreeBSD、Linux、Mac OS X 以 及 Solaris 都 支持 被 称 为 PAM (Pluggable Authentication 
Modules， 可 插入 的 身份 验证 模块 ) 的 更 加 灵活 的 方案 。PAM 允许 管理 人 员 配 置 使 用 何 种 身份 验 
证 方法 来 访问 那些 使 用 PAM 库 编写 的 服务 。 


[286] 
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如 果 应 用 程序 需要 验证 用 户 是 否 具 有 适当 的 权限 去 执行 某 个 服务 ， 那 么 我 们 要 么 将 身份 验证 
机 制 编写 到 应 用 中 ， 要 么 使 用 PAM 库 得 到 同样 的 功能 。 使 用 PAM 的 优点 是 ， 管 理 员 可 以 基于 本 
地 策略 、 针 对 不 同 任务 配置 不 同 的 验证 用 户 身份 的 方法 。 


如 果 用 户 正 确 登 录 ，1login 就 将 完成 如 下 工作 。 


。 将 当前 工作 目录 更 改 为 该 用 户 的 起 始 目录 (chdir). 
。 调用 chown 更 改 该 终端 的 所 有 权 ， 使 登录 用 户 成 为 它 的 所 有 者 。 


将 对 该 终端 设备 的 访问 权限 改变 成 “用 户 读 和 写 ”。 


e 调用 setgid & initgroups 设置 进程 的 组 ID。 


execl("/bin/sh", "-sh", (char *)0); 


用 login 得 到 的 所 有 信息 初始 化 环境 : 起 始 目录 CHOME), shell (SHELL), 用 户 名 (USER 
和 LOGNAME) 以 及 一 个 系统 默认 路 径 (PATH). 
login 进程 更 改 为 登录 用 户 的 用 户 ID (setuid) 并 调用 该 用 户 的 登录 shell, 其 方式 类 似 于 : 


argv[0] 的 第 一 个 字符 负 号 “-” 是 一 个 标志 ， 表 示 该 shell 被 作为 登录 shell FA. shell 可 


以 查看 此 字符 ， 并 相应 地 修改 其 启动 过 程 。 


login 程序 实际 所 做 的 比 上 面 说 的 要 多 。 它 可 选择 地 打印 日 期 消息 (message-of-the-day) 文 
件 、 检 查 新 邮件 以 及 执行 其 他 一 些 任务 。 本 章 中 我 们 主要 关心 上 面 所 说 的 功能 。 

回忆 8.11 节 中 对 setuid 函数 的 讨论 ， 因 为 setuid 是 由 超级 用 户 调用 的 ， 它 更 改 所 有 3 
个 用 户 ID: 实际 用 户 ID、 有 效用 户 ID 和 保存 的 用 户 ID. login 在 较 早 时 间 调 用 的 setgid 对 


所 有 3 个 组 ID 也 有 同样 效果 。 

至 此 ， 登 录用 户 的 登录 shell 开始 运行 。 其 父 进程 
ID 是 init 进程 (进程 ID 1)， 所 以 当 此 登录 shell 终止 
时 ，init 会 得 到 通知 ( 接 到 SIGCHLD 信号 )， 它 会 天 
该 终端 重复 全 部 上 述 过 程 。 登 录 shell 的 文件 描述 符 0、 
1 和 2 设置 为 终端 设备 。 图 9-3 显示 了 这 种 安排 。 

现在 ， 登 录 shell 读 取 其 启动 文件 (Bourne shell 
和 Korn shell 是 .profile, GNU Bourne-again shell 
是 .bash profile、.bash login 或 .profile， 
C shell 是 .cshrc 和 .1ogin)。 这 些 启动 文件 通常 更 
改 某 些 环境 变量 并 增加 很 多 环境 变量 。 例 如 ， 大 多 数 
用 户 设 置 他 们 自己 的 PATH 并 常常 提示 实际 终端 类 型 
(TERM)。 当 执行 完 启动 文件 后 ， 用 户 最 后 得 到 shell 
提示 符 ， 并 能 键入 命令 。 

2. Mac OS X 终端 登录 


进程 ID 1 


登录 shell 


fd 0,1,2 


终端 设备 驱动 
} 硬 连 接 


图 9-3 终端 登录 完成 各 种 设置 后 的 进程 安排 


} 通过 getty 和 login 













Mac OS X 部 分 地 基于 FreeBSD， 所 以 其 终端 登录 进程 与 BSD 终端 登录 进程 的 工作 步骤 基本 


相同 。 但 是 ，Mac OS X 有 些 不 同 之 处 。 
e init 的 工作 是 由 launchd 完成 的 。 
。 一 开始 提供 的 就 是 图 形 终端 。 
3. Linux 终端 登录 


Linux 的 终端 登录 过 程 非常 类 似 于 BSD. ME, Linux login 命令 是 从 43BSD login 命令 
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派生 出 来 的 。BSD 登录 过 程 与 Linux 登录 过 程 的 主要 区 别 在 于 说 明 终 端 配置 的 方式 。 

在 System V 的 init 文件 格式 之 后 ， 有 些 Linux 发 行 版 的 init 程序 使 用 了 管理 文件 方式 。 在 
这 些 系统 中 , /etc/inittab 包含 配置 信息 , 指定 了 init 应 当 为 之 启动 getty 进程 的 各 终端 设备 。 

其 他 Linux 发 行 版 本 ， 如 最 近 的 Ubuntu 发 行 版 ， 配 有 称 为 “Upstart” 的 init 程序 。 使 用 存 
放 在 /etc/init 目录 的 * .conf 命名 的 配置 文件 。 例 如 ， 运 行 /dev/ttyl 上 的 getty 需要 的 
说 明 可 能 放 在 /etc/init/ttyl.conf 文件 中 。 

根据 所 使 用 的 getty 版 本 的 不 同 ， 终 端的 特征 要 么 在 命令 行 中 说 明 (如 agetty)， 要 么 在 
/etc/gettydefs 文件 中 说 明 (如 mgetty)。 

4. Solaris 终端 登录 

Solaris 支持 两 种 形式 的 终端 登录 : (a) getty 方式 ， 这 与 前 面 对 BSD 终端 登录 的 说 明 一 样 ; 
(b) ttymon 登录 ， 这 是 SVR4 引入 的 一 种 新 特性 。 通 常 ，getty 用 于 控制 台 ，ttymon 则 用 于 
其 他 终端 的 登录 。 

ttymon 命令 是 服务 访问 设施 (Service Access Facility, SAF) 的 一 部 分 。SAF 的 目的 是 用 一 
致 的 方式 对 提供 系统 访问 的 服务 进行 管理 (关于 SAF 的 详细 信息 可 以 参见 Rago[1993] 的 第 6 章 )。 
按照 本 书 的 宗旨 ， 我 们 只 简单 说 明 从 init 到 登录 shell 之 间 不 同 的 工作 步骤 ， 最 后 结果 与 图 9-3 
中 所 示 相 似 。 init Æ sac (service access controller, 服务 访问 控制 器 ) 的 父 进程 , sac 调用 fork, 
然后 ， 当 系统 进入 多 用 户 状态 时 ， 其 子 进程 执行 ttymon 程序 。ttymon 监控 在 配置 文件 中 列 出 
的 所 有 终端 端口 ， 当 用 户 键 入 登录 名 时 ， 它 调用 一 次 fork。 在 此 之 后 ttymon 的 子 进程 执行 
login， 它 向 用 户 发 出 提示 ， 要 求 输入 口令 字 。 一 旦 完成 这 一 处 理 ，login 执行 登录 用 户 的 登录 
shell， 于 是 到 达 了 图 9-3 中 所 示 的 位 置 。 一 个 区 别 是 用 户 登 录 shell 的 父 进 程 现在 是 ttymon， 而 
在 getty 登录 中 ， 登 录 shell 的 父 进程 是 init。 
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通过 串 行 终端 登录 至 系统 和 经 由 网 络 登录 至 系统 两 者 之 间 的 主要 (物理 上 的 ) 区 别 是 : 网 络 
登录 时 ， 在 终端 和 计算 机 之 间 的 连接 不 再 是 点 到 点 的 。 在 网 络 登录 情况 下 ，login 仅仅 是 一 种 可 
用 的 服务 ， 这 与 其 他 网 络 服务 (如 FTP 或 SMTP) 的 性 质 相同 。 

在 上 节 所 述 的 终端 登录 中 ，init 知道 哪些 终端 设备 可 用 来 进行 登录 ， 并 为 每 个 设备 生成 一 
A getty 进程 。 但 是 ， 对 网 络 登录 情况 则 有 所 不 同 ， 所 有 登录 都 经 由 内 核 的 网 络 接口 驱动 程 
序 〈 如 以 太 网 驱动 程序 )， 而 且 事先 并 不 知道 将 会 有 多 少 这 样 的 登录 。 因 此 必须 等 待 一 个 网 络 连 
接 请 求 的 到 达 ， 而 不 是 使 一 个 进程 等 待 每 一 个 可 能 的 登录 。 

为 使 同一 个 软件 既 能 处 理 终端 登录 , 又 能 处 理 网 络 登录 , 系统 使 用 了 一 种 称 为 伪 终 端 (pseudo 
terminal) 的 软件 驱动 程序 ， 它 仿真 捉 行 终端 的 运行 行为 ， 并 将 终端 操作 映射 为 网 络 操 作 ， 反 之 亦 
然 。( 在 第 19 章 ， 我 们 将 详细 说 明 伪 终端 。) 

1. BSD 网 络 登 录 

在 BSD 中 ， 有 一 个 inetd 进程 (有 时 称 为 因特网 超级 服务 器 )， 它 等 待 大 多 数 网 络 连接 。 本 
节 将 说 明 BSD 网 络 登录 中 所 涉及 的 进程 序列 。 关 于 这 些 进 程 的 网 络 程序 设计 方面 的 细节 请 参阅 
Stevens. Fenner 和 Rudoff [2004]. 

作为 系统 启动 的 一 部 分 ，init 调用 一 个 shell， 使 其 执行 shell 脚本 /etc/rc。 由 此 shell 脚本 启动 
一 个 守护 进程 inetd。 一 旦 此 shell 脚本 终止 ，ineta 的 父 进 程 就 变 成 init。inetd 5f TCP/IP 3€ 
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接 请 求 到 达 主机 ， 而 当 一 个 连接 请 求 到 达 时 ， 它 执行 一 次 fork, 然后 生成 的 子 进程 exec 适当 的 程序 。 

假定 一 个 对 于 TELNET 服务 进程 的 TCP 连接 请 求 到 达 。TELNET 是 使 用 TCP 协议 的 远程 登 
录 应 用 程序 。 在 另 一 台 主 机 《〈 它 通过 某 种 形式 的 网 络 与 服务 进程 主机 相连 接 ) 上 的 用 户 ， 或 在 同 
一 个 主机 上 的 一 个 用 户 启动 TELNET 客户 进程 ， 由 此 启动 登录 过 程 : 


telnet hostname 


该 客户 进程 打开 一 个 到 hostname 主机 的 TCP 连接 ， 在 hostname 主机 上 启动 的 程序 被 称 为 TELNET 
服务 进程 。 然 后 ， 客 户 进程 和 服务 进程 之 间 使 用 TELNET 应 用 协议 通过 TCP 连接 交换 数据 。 启 动 客 
户 进程 的 用 户 现在 登录 到 了 服务 进程 所 在 的 主机 (当然 , 假定 用 户 在 服务 进程 主机 上 有 一 个 有 效 的 账 
号 )。 图 9-4 显示 了 在 执行 TELNET 服务 进程 〈 称 为 telnetd) 中 所 涉及 的 进程 序列 。 
进程 ID 1 
init 


/bin/sh 中 的 fork/exec, 


系统 出 现 多 用 户 时 ， 
执行 shell 脚本 etc/rc 


从 TELNET 客户 进程 来 的 
inetd 
TCP 连接 请 求 


1 fork | M TELNET 客户 进程 来 
的 连接 请 求 到 达 时 





telnetd 


图 9-4 447 TELNET 服务 进程 时 调用 的 进程 序列 

SRG, telnetd 进程 打开 一 个 伪 终 端 设 备 ， 并 用 fork 分 成 两 个 进程 。 父 进程 处 理 通过 网 络 
连接 的 通信 ,， 子 进程 则 执行 login 程序 。 父 进程 和 子 进程 通过 伪 终 端 相 连接 。 在 调用 exec 之 前 ， 
子 进程 使 其 文件 描述 符 0、1、2 与 伪 终 端 相 连 。 如 果 登 
录 正 确 ,1ogin 就 执行 9.2 节 中 所 述 的 同样 步骤 一 一 更 
改 当前 工作 目录 为 起 始 目 录 、 设 置 登 录用 户 的 组 ID、 
用 户 ID 以 及 初始 环境 。 然 后 login 调用 exec 将 其 : uo telnetd, 
自身 替换 为 登录 用 户 的 登录 shell. K 9-5 显示 了 到 达 
这 一 点 时 的 进程 安排 。 

很 明显 ,在 伪 终 端 设备 驱动 程序 和 实际 终端 用 户 之 
间 进 行 了 很 多 工作 。 第 19 章 详细 说 明 伪 终端 时 ， 我 们 


进程 ID 1 


init 






fd 0, 1,2 





将 介绍 与 这 种 安排 相关 的 所 有 进程 。 
需要 理解 的 重点 是 : 当 通 过 终端 〈 见 图 9-3) 或 网 i i 
络 ( 见 图 9-5) 登录 时 ， 我 们 得 到 一 个 登录 shell， 其 标 : telnet 客户 的 网 络 链接 


准 输入 、 标 准 输出 和 标准 错误 要 么 连接 到 一 个 终端 设 
备 ， 要 么 连接 到 一 个 伪 终 端 设备 上 。 在 后 面 儿 节 中 我 们 

会 了 解 到 这 一 登录 shell 是 一 个 POSIX.1 会 话 的 开始 ， 图 9-5 网 络 登 录 完 成 各 种 设置 后 的 进程 安排 
而 此 终端 或 伪 终端 则 是 会 话 的 控制 终端 
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2. Mac OS X 网 络 登录 
Mac OS X 是 部 分 地 基于 FreeBSD 的 ， 所 以 其 网 络 登 录 与 BSD 网 络 登 录 基 本 相同 。 但 Mac OS 
X 上 telnet 守护 进程 是 从 launchd 运行 的 。 


telnet 守护 进程 在 Mac OS X 中 默认 是 禁用 的 (虽然 可 以 通过 launchct1(1) 命 令 启用 )。 
Mac OS X 上 执行 网 络 登录 的 更 好 办 法 是 用 使 ssh (安全 shell 命令 )。 


3. Linux 网 络 登录 

除了 有 些 版 本 使 用 扩展 的 因特网 服务 守护 进程 xinetd 代替 inetd 进程 外 , Linux 网 络 登录 
的 其 他 方面 与 BSD 网 络 登 录 相同 。xinetd 进程 对 它 所 启动 的 各 种 服务 的 控制 比 inetd 提供 的 
控制 更 加 精细 。 

4. Solaris 网 络 登 录 

Solaris 中 网 络 登录 的 工作 过 程 与 BSD 和 Linux 中 的 步骤 几乎 一 样 。 同 样 使 用 了 类 似 于 BSD 
版 的 inetd 服务 进程 , 但 是 在 Solaris P, inetd 服务 进程 在 服务 管理 设施 (Service Management 
Facility, SMF) 下 作为 restarter 运行 。 这 个 restarter 是 守护 进程 ， 它 负责 启动 和 监视 其 他 守护 进 
程 ， 如 果 其 他 守护 进程 失败 的 话 ，restarter 重启 这 些 失 效 进程 。 虽 然 inetd 服务 程序 由 SMF 中 
的 主 restarter 启动 ， 但 实际 上 主 restarter 是 由 init 程序 启动 的 ， 最 后 得 到 的 结果 与 图 9-5 中 一 样 。 


Solaris 服务 管理 设施 是 管理 和 监视 系统 服务 的 框架 ， 提 供 了 一 种 从 影响 系统 服务 的 故障 中 恢复 的 
途径 。 关 于 服务 管理 设施 的 更 多 内 容 ， 可 参阅 Adams[2005] 以 及 Solaris 系统 手册 smf(5) 和 inetd(1MD)。 
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每 个 进程 除了 有 一 进程 ID 之 外 ， 还 属于 一 个 进程 组 ， 第 10 章 讨论 信号 时 还 会 涉及 进程 组 。 

进程 组 是 一 个 或 多 个 进程 的 集合 。 通 常 ， 它 们 是 在 同一 作业 中 结合 起 来 的 〈9.8 节 将 详细 讨 
论 作 业 控 制 )， 同 一 进程 组 中 的 各 进程 接收 来 自 同 一 终端 的 各 种 信号 。 每 个 进程 组 有 一 个 唯一 的 
进程 组 ID。 进 程 组 ID 类 似 于 进程 ID 一 一 它 是 一 个 正 整 数 ， 并 可 存放 在 pia c 数据 类 型 中 。 函 
数 getpgrp 返回 调用 进程 的 进程 组 ID. 


#include <unistd.h> 


pid_t getpgrp(void); 
返回 值 : 调用 进程 的 进程 组 ID 
在 早期 BSD 派生 的 系统 中 ， 该 函数 的 参数 是 _ pid， 返 回 该 进程 的 进程 组 ID. Single UNIX 
Specification 定义 了 getpgid 函数 模仿 此 种 运行 行为 。 293 


#include <unistd.h> 





pid t getpgid(pid t pid); 





返回 值 ， 若 成 功 ， 返 回 进程 组 ID; 车 出 错 ， 返 回 -1 
若 pid 是 0， 返回 调用 进程 的 进程 组 ID， 于 是 ， 
getpgid(0); 
等 价 于 


getpgrp(); 
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每 个 进程 组 有 一 个 组 长 进程 。 组 长 进程 的 进程 组 ID 等 于 其 进程 ID。 

进程 组 组 长 可 以 创建 一 个 进程 组 、 创 建 该 组 中 的 进程 ， 然 后 终止 。 只 要 在 某 个 进程 组 中 有 一 
个 进程 存在 ， 则 该 进程 组 就 存在 ， 这 与 其 组 长 进程 是 否 终止 无 关 。 从 进程 组 创建 开始 到 其 中 最 后 
一 个 进程 离开 为 止 的 时 间 区 间 称 为 进程 组 的 生命 期 。 某 个 进程 组 中 的 最 后 一 个 进程 可 以 终止 ， 也 
可 以 转移 到 另 一 个 进程 组 。 

进程 调用 setpgid 可 以 加 入 一 个 现 有 的 进程 组 或 者 创建 一 个 新 进程 组 (下 一 节 中 将 说 明 用 
setsid 也 可 以 创建 一 个 新 的 进程 组 )。 


#include <unistd.h> 


int setpgid(pid t pid, pid t pgid); 





返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1! 


setpgid 函数 将 pid 进程 的 进程 组 ID 设置 为 pgid。 如 果 这 两 个 参数 相等 ， 则 由 pid 指定 的 
进程 变 成 进程 组 组 长 。 如 果 pid 是 0， 则 使 用 调用 者 的 进程 ID。 另 外 ， 如 果 pgi 是 0， 则 由 pid 
指定 的 进程 ID 用 作 进 程 组 ID。 

一 个 进程 只 能 为 它 自己 或 它 的 子 进 程 设置 进程 组 ID。 在 它 的 子 进程 调用 了 exec 后 ， 它 就 不 
再 更 改 该 子 进程 的 进程 组 ID。 

在 大 多 数 作业 控制 shell F, Æ fork 之 后 调用 此 函数 ， 使 父 进程 设置 其 子 进程 的 进程 组 ID, 
并 且 也 使 子 进程 设置 其 自己 的 进程 组 ID。 这 两 个 调用 中 有 一 个 是 匈 余 的 , 但 让 父 进程 和 子 进程 都 
这 样 做 可 以 保证 ， 在 父 进程 和 子 进程 认为 子 进程 已 进入 了 该 进程 组 之 前 ， 这 确实 已 经 发 生 了 。 如 
果 不 这 样 做 ， 在 fork 之 后 ， 由 于 父 进程 和 子 进程 运行 的 先后 次 序 不 确定 ， 会 因为 子 进程 的 组 员 
身份 取决 于 哪个 进程 首先 执行 而 产生 竞争 条 件 。 

在 讨论 信号 时 ， 将 说 明 如 何 将 一 个 信号 发 送 给 一 个 进程 〈 由 其 进程 ID 标识 ) 或 发 送 给 一 个 
进程 组 (由 进程 组 ID 标识 )。 类 似 地 ，8.6 节 的 waitpid 函数 可 被 用 来 等 待 一 个 进程 或 者 指定 进 

程 组 中 的 一 个 进程 终止 。 


9.5 会 话 


会 话 (session) 是 一 个 或 多 个 进程 组 的 集合 。 例 如 ， 可 以 具有 图 9-6 中 所 示 的 安排 。 其 中 ， 
在 一 个 会 话 中 有 3 个 进程 组 。 
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会 话 
图 9-6 进程 组 和 会 话 中 的 进程 安排 
通常 是 由 shell 的 管道 将 几 个 进程 编 成 一 组 的 。 例 如 ， 图 9-6 中 的 安排 可 能 是 由 下 列 形式 的 shell 
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命令 形成 的 : 


procl | proc2 & 
proc3 | proc4 | proc5 


进程 调用 setsid 函数 建立 一 个 新 会 话 。 
#include <unistd.h> 


pid_t setsid(void); 





返回 值 : 若 成 功 ， 返 回 进程 组 ID; 若 出 错 ， 返 回 -1 


如 果 调 用 此 函数 的 进程 不 是 一 个 进程 组 的 组 长 ， 则 此 函数 创建 一 个 新 会 话 。 有 具体 会 发 生 以 下 3 件 事 。 

(1) 该 进程 变 成 新 会 话 的 会 话 首 进程 (session leader， 会 话 首 进程 是 创建 该 会 话 的 进程 )。 此 
时 ， 该 进程 是 新 会 话 中 的 唯一 进程 。 

(2) 该 进程 成 为 一 个 新 进程 组 的 组 长 进程 。 新 进程 组 ID 是 该 调用 进程 的 进程 ID。 

(3) 该 进程 没有 控制 终端 〈 下 一 节 讨 论 控制 终端 )。 如 果 在 调用 setsid 之 前 该 进程 有 一 个 
控制 终端 ， 那 么 这 种 联系 也 被 切断 。 

如 果 该 调用 进程 已 经 是 一 个 进程 组 的 组 长 ， 则 此 函数 返回 出 错 。 为 了 保证 不 处 于 这 种 情况 , 通 
常 先 调用 fork， 然 后 使 其 父 进 程 终 止 ， 而 子 进 程 则 继续 。 因 为 子 进程 继承 了 父 进程 的 进程 组 ID, 
而 其 进程 ID 则 是 新 分 配 的 ， 两 者 不 可 能 相等 ， 这 就 保证 了 子 进程 不 是 一 个 进程 组 的 组 长 。 

Single UNIX Specification 只 说 明了 会 话 首 进程 ,而 没有 类 似 于 进程 ID 和 进程 组 ID HZ is ID. 
显然 ， 会 话 首 进程 是 具有 唯一 进程 ID 的 单个 进程 ， 所 以 可 以 将 会 话 首 进 程 的 进程 ID 视 为 会 话 ID。 
会 话 ID 这 一 概念 是 由 SVR4 引入 的 。 历 史上 ， 基 于 BSD 的 系统 并 不 支持 这 个 概念 ， 但 后 来 改 弦 
Sy RH SSID. getsid 函数 返回 会 话 首 进程 的 进程 组 ID. 

一 些 实现 (如 Solaris ) 4 Single UNIX Specification 保持 一 致 ， 在 实践 中 避免 使 用 “会 话 ID" 
这 一 短语 ， 而 是 将 此 称 为 “会 话 首 进程 的 进程 组 ID"。 会 话 首 进程 总 是 一 个 进程 组 的 组 长 进程 ， 
所 以 两 者 是 等 价 的 。 











#include <unistd.h> 


pid_t getsid(pid_t pid); 





返回 值 : 若 成 功 ， 返 回 会 话 首 进程 的 进程 组 ID: 车 出 错 ， 返 回 -1 


如 车 pid 0, getsid 返回 调用 进程 的 会 话 首 进程 的 进程 组 ID。 出 于 安全 方面 的 考虑 ， 一 
些 实现 有 如 下 限制 ， 如若 pid 并 不 属于 调用 者 所 在 的 会 话 ， 那 么 调用 进程 就 不 能 得 到 该 会 话 首 进 
程 的 进程 组 ID. 
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会 话 和 进程 组 还 有 一 些 其 他 特性 。 

。 一 个 会 话 可 以 有 一 个 控制 终端 (controlling terminal)。 这 通常 是 终端 设备 〈 在 终端 登录 情 
况 下 ) 或 伪 终 端 设备 (在 网 络 登录 情况 下 )。 

。 建立 与 控制 终端 连接 的 会 话 首 进 程 被 称 为 控制 进程 (controlling process). 

e 一 -个 会 话 中 的 几 个 进程 组 可 被 分 成 一 个 前 台 进 程 组 (foreground process group) 以 及 一 个 
或 多 个 后 台 进 程 组 (background process group)。 
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。 如 果 一 个 会 话 有 一 个 控制 终端 ， 则 它 有 一 个 前 台 进 程 组 ， 其 他 进程 组 为 后 台 进 程 组 。 
。 无 论 何 时 键入 终端 的 中 断 键 (常常 是 Delete 或 CtrlIHC)， 都 会 将 中 断 信号 发 送 至 前 台 进 程 
296 组 的 所 有 进程 。 
。 无 论 何 时 键入 终端 的 退出 键 〈 常 常 是 CtlHN\)， 都 会 将 退出 信号 发 送 至 前 台 进 程 组 的 所 有 进程 。 
. 如 果 终 端 接 口 检测 到 调制 解 调 器 (或 网 络 ) 已 经 断 开 连接 ， 则 将 挂 断 信 和 号 发 送 至 控制 进 
程 (会 话 首 进程 )。 














这 些 特 性 示 于 图 9-7 中 。 
I ee eem 会 话 
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控制 终端 


图 9-7 进程 组 、 会 话 和 控制 终端 
通常 ， 我 们 不 必 担 心 控制 终端 ， 登 录 时 ， 将 自动 建立 控制 终端 。 

POSIX.1 将 如 何 分 配 一 个 控制 终端 的 机 制 交 给 具体 实现 来 选择 。19.4 节 中 将 说 明 实 际 步 又 。 

当 会 话 首 进 程 打开 第 一 个 尚未 与 一 个 会 话 相 关联 的 终端 设备 时 ， 只 要 在 调用 open 时 没有 指 
X O NOCTTY 标志 ( 见 3.3 节 )，System V 派生 的 系统 将 此 作为 控制 终端 分 配给 此 会 话 。 

当 会 话 首 进程 用 TIOCSCTTY 作为 request 参数 ( 第 三 个 参数 是 空 指针 ) 调 用 ioctl 时 , AF BSD 
的 系统 为 会 话 分 配 控制 终端 。 为 使 此 调用 成 功 执行 ， 此 会 话 不 能 已 经 有 一 个 控制 终端 (通常 ioctl] 调 
用 紧 跟 在 setsid 调用 之 后 , setsid 保证 此 进程 是 一 个 没有 控制 终端 的 会 话 首 进程 )。 除了 以 兼容 模 
式 支 持 其 他 系统 以 外 ， 基 于 BSD 的 系统 不 使 用 POSIX.1 中 对 open 函数 所 说 明 的 O_NOCTTY 标志 。 

图 9-8 总 结 了 本 书 讨论 的 4 个 平台 分 配 控制 终端 的 方式 。 注 意 ， 虽 然 Mac OS X 10.6.8 是 从 

BSD 派生 出 来 的 ， 但 其 分 配 控制 终端 的 方式 如 同 System V。 


COO r e rr 
没有 指定 O_NOCTTY 的 open 
TIOCSCTTY ioctl 命令 

图 9-8 不同 的 实现 分 配 控制 终端 的 方式 


有 时 不 管 标准 输入 、 标 准 输出 是 否 重 定向 ， 程 序 都 要 与 控制 终端 交互 作用 。 保 证 程序 能 与 控 
制 终端 对 话 的 方法 是 open 文件 /dev/tty。 在 内 核 中 ， 此 特殊 文件 是 控制 终端 的 同 义 语 。 自 然 
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地 ， 如 果 程 序 没 有 控制 终端 ， 则 对 于 此 设备 的 open HAM. 
典型 的 例子 是 用 于 读 口令 的 getpass(3) 函 数 〈 终 端 回 显 被 关闭 )。 这 一 函数 由 crypt(1) 程 
序 调用 ， 并 可 用 于 管道 中 。 例 如 : 


crypt < salaries | lpr 


将 文件 salaries 解密 ， 然 后 经 由 管道 将 输出 送 至 打印 缓冲 服务 程序 。 因 为 crypt 从 其 标准 
输入 读 输 入 文件 ， 所 以 标准 输入 不 能 用 于 输入 口令 。 而 且 ，crypt 经 过 了 设计 ， 因 此 每 次 运行 
此 程序 时 都 应 输入 加 密 口 令 , 这 样 也 就 阻止 了 用 户 将 口令 存放 在 文件 中 (这 会 造成 安全 性 漏洞 )。 

已 经 知道 有 一 些 方法 可 以 破译 crypt 程序 使 用 的 密码 。 关 于 加 密 文件 的 详细 情况 请 参见 
Garfinkel 等 [2003]。 


9.7 函数 tcgetpgrp、tcsetpgrp 和 tcgetsid 


需要 有 一 种 方法 来 通知 内 核 哪 一 个 进程 组 是 前 台 进 程 组 ， 这 样 ， 终 端 设备 驱动 程序 就 能 知道 
将 终端 输入 和 终端 产生 的 信号 发 送 到 何 处 〈 见 图 9-7)。 
#include <unistd.h> 


pid_t tcgetpgrp(int fd); 


返回 值 ; 若 成 功 ， 返 回 前 台 进程 组 ID; 若 出 错 ， 返 回 -1 


int tcsetpgrp(int fd, pid t pgrpid) ; 





返回 值 ， 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


函数 tcgetpgrp 返回 前 台 进 程 组 ID， 它 与 在 应 上 打开 的 终端 相关 联 。 
如 果 进 程 有 一 个 控制 终端 ， 则 该 进程 可 以 调用 tcsetpgrp 将 前 台 进 程 组 ID 设置 为 pgrpid。 
perpid 值 应 当 是 在 同一 会 话 中 的 一 个 进程 组 的 ID。 应 必须 引用 该 会 话 的 控制 终端 。 
大 多 数 应 用 程序 并 不 直接 调用 这 两 个 函数 。 它 们 通常 由 作业 控制 shell 调用 。 
给 出 控制 TTY 的 文件 描述 符 ， 通 过 tcgetsid 函数 ， 应 用 程序 就 能 获得 会 话 首 进程 的 进程 
组 ID。 


#include <termios.h> 


pid t tcgetsid(int fd); 





返回 值 : 若 成 功 ， 返 回 会 话 首 进程 的 进程 组 ID; 若 出 错 ， 返 回 -1 


需要 管理 控制 终端 的 应 用 程序 可 以 调用 tcgetsid 函数 识别 出 控制 终端 的 会 话 首 进程 的 会 
话 ID《〈 它 等 价 于 会 话 首 进程 的 进程 组 ID). 
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作业 控制 是 BSD 在 1980 年 左右 增加 的 一 个 特性 。 它 允许 在 一 个 终端 上 启动 多 个 作业 (进程 组 )， 
它 控制 哪 一 个 作业 可 以 访问 该 终端 以 及 哪些 作业 在 后 台 运 行 。 作 业 控制 要 求 以 下 3 种 形式 的 支持 。 

(1) 支持 作业 控制 的 shell。 

(2) 内 核 中 的 终端 驱动 程序 必须 支持 作业 控制 。 

G) 内 核 必须 提供 对 某 些 作业 控制 信号 的 支持 。 
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SVR3 提供 了 一 种 不 同 的 作业 控制 ， 称 为 shell 层 (shell layer )。 但 是 POSIX.1 选择 了 BSD 形 
式 的 作业 控制 ， 这 也 是 我 们 在 这 里 所 说 明 的 。POSIX.1 的 早期 版 本 中 ， 对 作业 控制 的 支持 是 可 选 
择 的 ， 现 在 则 要 求 所 有 平台 都 支持 它 。 


从 shell 使 用 作业 控制 功能 的 角度 观察 , 用 户 可 以 在 前 台 或 后 台 启 动 一 个 作业 。 一 个 作业 只 是 
儿 个 进程 的 集合 ， 通 常 是 一 个 进程 管道 。 例 如 : 


在 前 台 启 动 了 只 有 一 个 进程 组 成 的 作业 。 下 面 的 命令 : 


pr *.c | lpr & 
make all & 


在 后 台 启 动 了 两 个 作业 。 这 两 个 后 台 作 业 调 用 的 所 有 进程 都 在 后 台 运 行 。 

如 前 所 述 , 我 们 需要 一 个 支持 作业 控制 的 shell 以 使 用 由 作业 控制 提供 的 功能 。 对 于 早期 的 系 
统 , shell 是 否 支持 作业 控制 比较 易于 说 明 。C shell 支持 作业 控制 , Bourne shell 不 支持 , 而 Korn shell 
能 否 支持 作业 控制 取决 于 主机 是 否 支持 作业 控制 .但 是 现在 C shell 已 被 移植 到 并 不 支持 作业 控制 的 
系统 上 (如 System V 的 早期 版 本 )， 而 当 用 名 字 jsh 而 不 是 用 sh 调用 SVR4 中 的 Bourne shell BT, 
它 支持 作业 控制 。 如 果 主 机 支持 作业 控制 ， 则 Korn shell 继续 支持 作业 控制 。Bourne-again shell 也 
支持 作业 控制 。 各 种 shell 之 间 的 差别 无 关 紧 要 时 ， 我 们 将 只 是 一 般 地 说 明 支 持 作 业 控制 的 shell 和 
不 支持 作业 控制 的 shell。 

当 启 动 一 个 后 台 作 业 时 ，shell 赋予 它 一 个 作业 标识 符 ， 并 打印 一 个 或 多 个 进程 ID。 下面 的 脚 
本 显示 了 Korn shell 是 如 何 处 理 这 一 点 的 。 


$ make all > Make.out & 


cay 1475 

$ pr *.c | lpr & 

[2] 1490 

$ 键入 回 车 

[2] + Done pr *.c | lpr & 

[1] * Done make all » Make.out & 


make 是 作业 编号 1， 所 启动 的 进程 ID 是 1475。 下 一 个 管道 是 作业 编号 2， 其 第 一 个 进程 的 进程 ID 
是 1490。 当 作业 完成 而 且 键 入 回 车 时 ，shell 通知 作业 已 经 完成 。 键 入 回 车 是 为 了 让 shell 打印 其 提示 
符 。shell 并 不 在 任意 时 刻 打印 后 台 作 业 的 状态 改变 一 一 它 只 在 打印 其 提示 符 让 用 户 输入 新 的 命令 行 之 
前 才 这 样 做 。 如 果 不 这 样 处理 ， 则 当 我 们 正 输入 一 行 时 ， 它 也 可 能 输出 ， 于 是 ， 就 会 引起 混乱 。 

我 们 可 以 键入 一 个 影响 前 台 作 业 的 特殊 字符 一 一 挂 起 键 (通常 采用 Ctrl+Z)， 与 终端 驱动 程 
序 进行 交互 作用 。 键入 此 字符 使 终端 驱动 程序 将 信号 SIGTSTP 发 送 至 前 台 进 程 组 中 的 所 有 进程 ， 
后 台 进 程 组 作业 则 不 受 影响 。 实 际 上 有 3 个 特殊 字符 可 使 终端 驱动 程序 产生 信号 ， 并 将 它们 发 送 
至 前 台 进 程 组 ， 它 们 是 : 

。 中 断 字 符 (一 般 采 用 Delete 或 Ctrl+C) 产生 SIGINT: 

e. 退出 字符 (一 般 采 用 Ctri+\) 产生 SIGQUIT; 

e. HEF (一般 采用 Ctrl+Z) 产生 SIGTSTP。 

第 18 章 中 将 说 明 可 将 这 3 个 字符 更 改 为 用 户 选 择 的 任意 其 他 字符 ， 以 及 如 何 使 终端 驱动 程 
序 不 处 理 这 些 特 殊 字 符 。 

终端 驱动 程序 必须 处 理 与 作业 控制 有 关 的 另 一 种 情况 。 我 们 可 以 有 一 个 前 台 作 业 , 若干 个 后 台 作 
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业 ,， 这 些 作业 中 哪 一 个 接收 我 们 在 终端 上 键入 的 字符 呢 ? 只 有 前 台 作业 接收 终端 输入 。 如 果 后 台 作 业 
试图 读 终端 ， 这 并 不 是 一 个 错误 ， 但 是 终端 驱动 程序 将 检测 这 种 情况 ， 并 且 向 后 台 作 业 发 送 一 个 特定 
信号 SIGTTIN。 该 信号 通常 会 停止 此 后 台 作 业 ， 而 shell 则 向 有 关 用 户 发 出 这 种 情况 的 通知 ， 然 后 用 ， 
户 就 可 用 shell 命令 将 此 作业 转 为 前 台 作业 运行 ， 于 是 它 就 可 读 终 端 。 下 列 操 作 过 程 显示 了 这 一 点 : 


$ cat > temp.foo & 在 后 台 启 动 ， 但 将 从 标准 输入 读 

[i] 1681 

$ 键入 回 车 

[1] + Stopped (SIGTTIN) cat > temp.foo & 

$ fg $1 使 1 号 作业 成 为 前 台 作 业 

cat > temp. foo shell 告诉 我 们 现在 哪 一 个 作业 在 前 台 
hello, world 输入 一 行 

^D 键入 文件 结束 符 

$ cat temp.foo 检查 该 行 已 送 入 文件 


hello, world 


注意 ， 这 个 例子 在 Mac OS X 10.6.8 上 不 起 作用 。 在 试图 把 cat 命令 放 到 前 台 时 ，read 返回 
失败 ， 并 将 errno 设 为 EINTR。Mac OS X X X T FreeBSD $, Æ FreeBSD 下 本 例 运行 良好 ， 
因此 这 应 该 是 Mac OSX 的 一 个 bug。 


shell 在 后 台 启 动 cat 进程 ， 但 是 当 cat 试图 读 其 标准 输入 〈 控 制 终 端 ) 时， 终端 驱动 程序 
知道 它 是 个 后 台 作 业 ， 于 是 将 SIGTTIN 信号 送 至 该 后 台 作 业 。shell 检测 到 其 子 进程 的 状态 改变 
(回忆 8.6 节 中 对 wait 和 waitpid 函数 的 讨论 )， 并 通知 我 们 该 作业 已 被 停止 。 然 后 ， 我 们 用 
shell 的 fg 命令 将 此 停止 的 作业 送 入 前 台 运 行 (关于 作业 控制 命令 ， 如 fg 和 bg 的 详细 情况 ， 以 
及 标识 不 同 作业 的 各 种 方法 请 参阅 有 关 shell 的 手册 页 )。 这 样 做 使 shell 将 此 作业 转 为 前 台 进 程 组 
(tcsetpgrp)， 并 将 继续 信号 (SIGCONT) 送 给 该 进程 组 。 因 为 该 作业 现在 前 台 进 程 组 中 ， 所 
以 它 可 以 读 控制 终端 。 

如 果 后 台 作 业 输 出 到 控制 终端 又 将 发 生 什 么 呢 ? 这 是 一 个 我 们 可 以 允许 或 禁止 的 选项 。 通 
常 ， 可 以 用 stty(1) 命 令 改 变 这 一 选项 (第 18 章 将 说 明 在 程序 中 如 何 改变 这 一 选项 )。 下 面 显示 
了 这 种 操作 过 程 : 


$ cat temp.foo & 在 后 台 执行 

Li 1719 

$ hello, world 提示 符 后 出 现 后 台 作 业 的 输出 
键入 回 车 

[1] + Done cat temp.foo & 

$ stty tostop 禁止 后 台 作 业 输 出 至 控制 终端 

$ cat temp.foo & 在 后 台 再 试 一 次 

[1] 1721 

$ 键入 回 车 ， 发 现 作 业已 停止 

[1] + Stopped (SIGTTOU) cat temp.foo & 

$ fg %1 在 前 台 恢 复 停止 的 作业 

cat temp .foo shell 告诉 我 们 现在 哪 一 个 作业 在 前 台 

hello, world 这 是 该 作业 的 输出 


在 用 户 禁 止 后 台 作 业 向 控制 终端 写 时 ， 该 作业 的 cat 命令 试图 写 其 标准 输出 ， 此 时 ,终端 驱动 程 
序 识 别 出 该 写 操作 来 自 于 后 台 进 程 ， 于 是 向 该 作业 发 送 SIGTTOU 信号 ，cat 进程 阻塞 。 与 上面 
的 例子 一 样 ， 当 用 户 使 用 shell 的 fg 命令 将 该 作业 转 为 前 台 时 ， 该 作业 继续 执行 直至 完成 。 

图 9-9 总 结 了 前 面 已 说 明 的 作业 控制 的 某 些 功 能 。 穿 过 终端 驱动 程序 框 的 实 线 表 明 终 端 LO 
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和 终端 产生 的 信号 总 是 从 前 台 进 程 组 连接 到 实际 终端 。 对 应 于 SIGTTOU 信号 的 虚线 表明 后 台 进 
程 组 进程 的 输出 是 否 出 现在 终端 是 可 选择 的 。 


init.inetd 或 launchd 


getty 或 
telnetd 






在 setsid JG, exec 
建立 控制 终端 








tcsetpgrp 为 控制 终端 设置 进程 组 








图 9-9 对 于 前 台 、 后 台 作 业 以 及 终端 驱动 程序 的 作业 控制 功能 总 结 


是 否 需 要 作业 控制 是 一 个 有 争议 的 问题 。 作 业 控 制 是 在 窗口 终端 广泛 得 到 应 用 之 前 设计 和 实现 

的 。 很 多 人 认为 设计 得 好 的 窗口 系统 已 经 免除 了 对 作业 控制 的 需要 。 某 些 人 抱怨 作业 控制 的 实现 要 求 

得 到 内 核 、 终 端 驱动 程序 、shell 以 及 某 些 应 用 程序 的 支持 ， 是 吃力 不 讨好 的 事情 。 某 些 人 在 窗口 系统 
中 使 用 作业 控制 ， 他 们 认为 两 者 都 需要 。 不 管 你 的 意见 如 何 ， 作 业 控 制 都 是 POSIX.1 要 求 的 部 分 。 
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让 我 们 检验 一 下 shell 是 如 何 执行 程序 的 ， 以 及 这 与 进程 组 、 控 制 终端 和 会 话 等 概念 的 关系 。 
为 此 ， 再 次 使 用 Ps 命令 。 
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首先 使 用 不 支持 作业 控制 的 、 在 Solaris 上 运行 的 经 典 Bourne shell。 如 果 执 行 : 
ps -o pid,ppid,pgid,sid,comm 
则 其 输出 可 能 是 : 


PID PPID PGID SID COMMAND 
949 947 949 949 sh 
1774 949 949 949 ps 


ps 的 父 进程 是 shell, 这 正 是 我 们 所 期 望 的 ,shell 和 ps 命令 两 者 位 于 同一 会 话 和 前 台 进 程 组 (949 ) 
中 。 因 为 我 们 是 用 一 个 不 支持 作业 控制 的 shell 执行 命令 时 得 到 该 值 的 ， 所 以 称 其 为 前 台 进 程 组 。 
某 些 平台 支持 一 个 选项 ， 它 使 ps(1) 命 令 打 印 与 会 话 控制 终端 相关 联 的 进程 组 ID。 该 值 在 
TPGID 列 中 显示 。 遗 憾 的 是 ，ps(1) 命 令 的 输出 在 各 个 UNIX 版 本 中 都 有 所 不 同 。 例如 ，Solaris 10 
不 支持 该 选项 。 在 FreeBSD 8.0、Linux 3.2.0 和 Mac OS X 10.6.8 中 ,命令 


ps -o pid, ppid, pgid, sid, tpgid, comm 


准确 地 打印 我 们 想 要 的 信息 。 

注意 , 将 进程 与 终端 进程 组 ID ( TPGID 列 ) 关联 起 来 有 点 用 词 不 当 。 进 程 并 没有 终端 进程 控制 组 。 
进程 属于 一 个 进程 组 ， 而 进程 组 属于 一 个 会 话 。 会 话 可 能 有 也 可 能 没有 控制 终端 。 如 果 它 确实 有 
一 个 控制 终端 ， 则 此 终端 设备 知道 其 前 台 进 程 的 进程 组 ID。 这 一 值 可 以 用 tcsetpgrp 函数 在 终 
端 驱 动 程序 中 设置 ( 见 图 9-9 )。 前台 进 程 组 ID 是 终端 的 一 个 属性 ， 而 不 是 进程 的 属性 。 取 自 终端 
设备 驱动 程序 的 该 值 是 ps Æ TPGID 列 中 打印 的 值 。 如 果 ps 发 现 此 会 话 没 有 控制 终端 ， 则 它 在 
该 列 打 印 0 或 者 -1， 具 体 值 因 不 同 平台 而 异 。 


如 果 在 后 台 执 行 命令 : 
ps -o pid,ppid,pgid,sid,comm & 
则 唯一 改变 的 值 是 命令 的 进程 ID: 


PID PPID PGID SID COMMAND 
949 947 949 949 sh 


1812 949 949 949 ps 
因为 这 种 shell 不 知道 作业 控制 , 所 以 没有 将 后 台 作 业 放 入 自己 的 进程 组 , 也 没有 从 后 台 作 业 处 取 
走 控制 终端 。 


现在 看 一 看 Bourne shell 如 何 处 理 管道 。 执 行 下 列 命令 : 
ps -o pid,ppid,pgid,sid,comm | catl 
其 输出 是 : 
PID PPID PGID SID COMMAND 
949 947 949 949 sh 


1823 949 949 949 cati 
1824 1823 949 949 ps 


(程序 cat1 是 标准 cat 程序 的 一 个 副本 , 只 是 名 字 不 同 。 本 节 还 将 使 用 cat 的 另 一 个 名 为 cat2 
的 副本 。 在 一 个 管道 中 使 用 两 个 cat 副本 时 ， 不 同 的 名 字 可 使 我 们 将 它们 区 分 开 来 。) 注意 ， 管 道 
中 的 最 后 一 个 进程 是 shell 的 子 进程 ， 该 管道 中 的 第 一 个 进程 则 是 最 后 一 个 进程 的 子 进程 。 从 中 可 
以 看 出 ，shell fork 一 个 它 自 身 的 副本 ， 然 后 此 副本 再 为 管道 中 的 每 条 命令 各 fork 一 个 进程 。 
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如 果 在 后 台 执行 此 管道 : 

ps -o pid,ppid,pgid,sid,comm | catl & 
则 只 改变 进程 ID。 因 为 shell 并 不 处 理 作 业 控制 ， 后 台 进 程 的 进程 组 ID 仍 是 949， 如 同 会 话 的 进 
程 组 ID 一 样 。 

如 果 一 个 后 台 进 程 试 图 读 其 控制 终端 ， 则 会 发 生 什 么 呢 ? Wn, ERIT: 


cat > temp.foo & 


在 有 作业 控制 时 ， 后 台 作 业 被 放 在 后 台 进 程 组 ， 如 果 后 台 作 业 试 图 读 控制 终端 ， 则 会 产生 信和 号 
SIGTTIN。 在 没有 作业 控制 时 ， 其 处 理 方 法 是 : 如 果 该 进程 自己 没有 重 定向 标准 输入 ， 则 shell 
自动 将 后 台 进 程 的 标准 输入 重 定向 到 /dev/null。 读 /dev/null 则 产生 一 个 文件 结束 。 这 就 意 
味 着 后 台 cat 进程 立即 读 到 文件 尾 ， 并 正常 终止 。 

前 面 说 明了 对 后 台 进 程 通过 其 标准 输入 访问 控制 终端 的 适当 的 处 理 方法 ， 但 是 ， 如 果 一 个 后 
台 进程 打开 /dev/tty 并 且 读 该 控制 终端 ， 又 将 怎样 呢 ? 对 此 问题 的 回答 是 “看 情况 ”。 但 是 这 
很 可 能 不 是 我 们 所 期 望 的 。 例 如 

crypt < salaries | lpr & 


就 是 这 样 的 一 条 管道 。 我 们 在 后 台 运 行 它 ， 但 是 crypt 程序 打开 /dev/tty， 更 改 终端 的 特性 〈 禁 
止 回 显 )， 然 后 从 该 设备 读 ， 最 后 重 置 该 终端 特性 。 当 执行 这 条 后 台 管道 时 ，crypt 在 终端 上 打印 提 
mt? “Password: ” 但 是 shell 读 取 了 我 们 所 输入 的 加 密 口 令 ， 并 试图 执行 以 加 密 口 令 为 名 称 的 命 
令 。 我 们 输送 给 shell 的 下 一 行 则 被 crypt 进程 取 为 口令 行 ， 于 是 salaries 也 就 不 能 正确 地 被 译 
码 ， 结 果 将 一 堆 无 用 的 信息 送 到 了 打印 机 。 在 这 里 ， 我 们 有 了 两 个 进程 ， 它 们 试图 同时 读 同一 设备 ， 
其 结果 则 依赖 于 系统 。 前 面 说 明 的 作业 控制 以 较 好 的 方式 处 理 一 个 终端 在 多 个 进程 间 的 转 接 。 

返回 到 Bourne shell 实例 ， 在 一 条 管道 中 执行 3 个 进程 ， 我 们 可 以 检验 Bourne shell 使 用 的 进 
程控 制 方式 : 

ps -o pid,ppid,pgid,sid,comm | catl | cat2 
其 输出 为 : 


PID PPID PGID SID COMMAND 


1990 1988 949 949 catl 


如 果 在 你 的 系统 上 ， 输 出 的 命令 名 不 正确 ， 那 也 不 必 为 此 感到 惊慌 。 有 时 可 能 会 得 到 类 似 如 
下 的 输出 : 
PID PPID PGID SID COMMAND 
949 947 949 949 sh 
1831 949 949 949 sh 


1832 1831 949 949 ps 
1833 1831 949 949 sh 


造成 此 种 结果 的 原因 是 ，ps 进程 与 shell 产生 竞争 条 件 ，shell 创建 一 个 子 进程 并 由 它 执 行 cat 命 
令 。 在 这 种 情况 下 ， 当 ps 已 经 获得 进程 列表 并 打印 时 ，shell 尚未 完成 exec 调用 。 


再 重申 一 遍 , 该 管道 中 的 最 后 一 个 进程 是 shell 的 子 进程 , 而 执行 管道 中 其 他 命令 的 进程 则 是 
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该 最 后 进程 的 子 进 程 。 图 9-10 显示 了 所 发 生 的 情况 。 因 为 该 管道 线 中 的 最 后 一 个 进程 是 登录 shell 
的 子 进程 ， 当 该 进程 (cat2) 终止 时 ，shell 得 到 通知 。 


exec ps 
o A roe *| (1989) 
«97 : 




















sh : " 
(949) DX 
1. 45 . 
NO 
S 
~A sh exec catl 
(1990) (1990) 


| (1988) 








图 9-10 Bourne shell 执行 管道 ps | cat1 | cat2 时 的 进程 
现在 让 我 们 用 一 个 运行 在 Linux 上 的 作业 控制 shell 来 检验 同一 个 例子 。 这 将 显示 这 些 shell 
处 理 后 台 作 业 的 方法 。 在 本 例 中 将 使 用 Bourne-again shell， 用 其 他 作业 控制 shell 得 到 的 结果 几乎 
是 一 样 的 。 
ps -o pid,ppid,pgid, sid, tpgid, comm 
其 输出 为 : 


PID PPID PGID SID TPGID COMMAND 
2837 2818 2837 2837 5796 bash 
5796 2837 5796 2837 5796 ps 


(从 本 例 开 始 ， 以 粗 体 显示 前 台 进 程 组 。) 我 们 立即 看 到 了 与 Bourne shell 例子 的 区 别 。Bourne-again 
shell 将 前 台 作 业 (ps) 放 入 了 它 自 己 的 进程 组 (5796). ps 命令 是 进程 组 组 长 进程 ， 也 是 该 进程 
组 的 唯一 进程 。 进 一 步 而 言 ， 此 进程 组 具有 控制 终端 ， 所 以 它 是 前 台 进 程 组 。 我 们 的 登录 shell 
在 执行 ps 命令 时 是 后 台 进 程 组 。 但 需要 注意 的 是 ， 这 两 个 进程 组 2837 和 5796 都 是 同一 会 话 的 
成 员 。 事 实 上 ， 在 本 节 的 各 实例 中 ， 会 话 决 不 会 改变 。 

在 后 台 执行 此 进程 : 

ps -o pid,ppid,pgid,sid,tpgid,comm & 
其 输出 为 : 


PID PPID PGID SID TPGID COMMAND 
2837 2818 2837 2837 2837 bash 
5797 2837 5797 2837 2837 ps 


再 一 次 ，ps 命令 被 放 入 它 自己 的 进程 组 ， 但 是 此 时 进程 组 5797) 不 再 是 前 台 进 程 组 ， 而 是 一 个 
于 台 进 程 组 。TPGID 2837 指示 前 台 进 程 组 是 登录 shell. 

按 下 列 方 式 在 一 个 管道 中 执行 两 个 进程 : 

ps -o pid,ppid,pgid,sid,tpgid,comm | catl 


其 输出 为 : 
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PID PPID PGID SID TPGID COMMAND 
2837 2818 2837 2837 5799 bash 
5799 2837 5799 2837 5799 ps 
5800 2837 5799 2837 5799 catı 


两 个 进程 ps 和 cati 都 在 一 个 新 进程 组 (5799) 中 ,这 是 一 个 前 台 进程 组 ,在 本 例 和 类 似 的 Bourne 
shell 实例 之 间 能 看 到 男 一 个 区 别 。Bourne shell 首先 创建 将 执行 管道 中 最 后 一 条 命令 的 进程 ， 而 
此 进程 是 第 一 个 进程 的 父 进程 。 在 这 里 ，Bourne-again shell 是 两 个 进程 的 父 进程 。 但 是 ， 如 果 在 
306| 后 台 执 行 此 管道 ; 
ps -o pid,ppid,pgid,sid,tpgid,comm | catl & 
其 结果 是 类 似 的 ， 但 是 ps 和 cat1 现在 都 处 于 同一 后 台 进 程 组 。 


PID PPID PGID SID TPGID COMMAND 
2837 2818 2837 2837 2837 bash 
5801 2837 5801 2837 2837 ps 
5802 2837 5801 2837 2837 catl 


注意 ， 使 用 的 shell 不 同 ， 创 建 各 个 进程 的 顺序 也 可 能 不 同 。 
9.10 ”孤儿 进程 组 


我 们 曾 提 及 ， 一 个 其 父 进程 已 终止 的 进程 称 为 孤儿 进程 (orphan process)， 这 种 进程 由 init 
进程 “收养 ”"。 现 在 我 们 要 说 明 整 个 进程 组 也 可 成 为 “孤儿 ”， 以 及 POSIX.1 如 何 处 理 它 。 


下 实例 
考虑 一 个 进程 , 它 fork 了 一 个 子 进程 然后 终止 。 这 在 系 | aB sid 
统 中 是 经 常 发 生 的 ， 并 无 异常 之 处 ， 但 是 在 父 进程 终止 时 ， got 
如 果 该 子 进程 停止 《用 作业 控制 ) 又 将 如 何 呢 ? 子 进程 如 何 | 1 
继续 ， 以 及 子 进程 是 否 知道 它 已 经 是 孤儿 进程 ? 图 9-11 显示 Mri 
了 这 种 情形 : 父 进程 已 经 fork 了 子 进 程 ， 该 子 进程 停止 ， 父 peek 3 
进程 则 将 退出 。 会 话 
构成 此 种 情形 的 程序 示 于 图 9-12 中 。 下 面 要 说 明 该 程序 
的 某 些 新 特性 。 这 里 ， 假 定 使 用 了 一 个 作业 控制 shell。 回 忆 
前 面 所 述 ，shell 将 前 台 进 程 放 在 它 〈 指 前 台 进 程 ) 自 己 的 进 
程 组 中 (本 例 中 是 6099), shell 则 留 在 自己 的 进程 组 内 (2837)。 ee 
子 进程 继承 其 父 进 程 (0099) 的 进程 组 。 在 fork 之 后 : | 进程 组 609 = — | 
o 父 进 程 睡眠 5 秒 ， 这 是 一 种 让 子 进程 在 父 进程 终止 之 ”图 9-11 将 要 成 为 孤儿 的 进程 组 实例 
前 运行 的 一 种 权宜 之 计 。 
e 子 进程 为 挂 断 信 号 (SIGHUP) 建立 信号 处 理 程序 。 这 样 就 能 观察 到 SIGHUP 信号 是 否 已 
发 送 给 子 进程 。( 第 10 章 将 讨论 信号 处 理 程序 。) 
。 子 进程 用 kill 函数 向 其 自身 发 送 停止 信号 〈SIGTSTP)。 这 将 停止 子 进程 ， 类 似 于 用 终 
端 挂 起 字符 (CtrltZ) 停止 一 个 前 台 作 业 。 
e 当 父 进程 终止 时 ， 该 子 进程 成 为 孤儿 进程 ， 所 以 其 父 进程 ID 成 为 1， 也 就 是 init ERE ID. 
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e 现在 ， 子 进程 成 为 一 个 孤儿 进程 组 的 成 员 。POSIX.1 将 孤儿 进程 组 (orphaned process group? 
EMA: 该 组 中 每 个 成 员 的 父 进 程 要 么 是 该 组 的 一 个 成 员 ， 要 么 不 是 该 组 所 属 会 话 的 成 
员 。 对 孤儿 进程 组 的 另 一 种 描述 可 以 是 : 一 个 进程 组 不 是 孤儿 进程 组 的 条 件 是 一 一 该 组 
中 有 一 个 进程 ， 其 父 进程 在 属于 同一 会 话 的 另 一 个 组 中 。 如 果 进 程 组 不 是 孤儿 进程 组 ， 
那么 在 属于 同一 会 话 的 另 一 个 组 中 的 父 进程 就 有 机 会 重新 启动 该 组 中 停止 的 进程 。 在 这 
里 ， 进 程 组 中 每 一 个 进程 的 父 进程 〈 例 如 ， 进 程 6100 的 父 进程 是 进程 1) 都 属于 另 一 个 
会 话 。 所 以 此 进程 组 是 孤儿 进程 组 。 

。 因为 在 父 进 程 终止 后 ， 进 程 组 包含 一 个 停止 的 进程 ， 进 程 组 成 为 孤儿 进程 组 ，POSIX.1 
要 求 向 新 孤儿 进程 组 中 处 于 停止 状态 的 每 一 个 进程 发 送 挂 断 信 号 (SIGHUP)， 接 着 又 向 
其 发 送 继续 信号 (SIGCONT). 

。 在 处 理 了 挂 断 信号 后 ， 子 进程 继续 。 对 挂 断 信 号 的 系统 默认 动作 是 终止 该 进程 ， 为 此 必 
须 提 供 一 个 信号 处 理 程 序 以 捕捉 该 信号 。 因 此 ， 我 们 期 望 sig_hup 函数 中 的 printf 会 
在 pr_ids 函数 中 的 printf 之 前 执行 。 


#include "apue.h" 
#include <errno.h> 


static void 
sig hup(int signo) 
{ 
printf("SIGHUP received, pid = %ld\n", (long) getpid()); 
} 


static void 
pr_ids(char *name) 
{ 
printf("%s: pid = $1d, ppid = %ld, pgrp = %ld, tpgrp = %ld\n", 
name, (long)getpid(), (long)getppid(), (long) getpgrp(), 
(long) tcgetpgrp (STDIN_FILENO) ); 
fflush (stdout) ; 


int 

main (void) 

{ 
char c; 
pid t pid; 


pr ids ("parent"); 
if ((pid = fork()) < 0) { 
err_sys ("fork error"); 
} else if (pid > 0) { /* parent */ 


sleep (5); /* sleep to let child stop itself */ 

} else { /* child */ 
pr.ids ("child"); 
signal (SIGHUP, sig hup); /* establish signal handler */ 
kill(getpid(), SIGTSTP); /* stop ourself */ 
pr ids("child"); /* prints only if we're continued */ 
if (read(STDIN FILENO, &c, 1) !- 1) 


printf("read error $d on controlling TTY\n", errno); 
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} 
exit(0); 


图 9-12 创建 一 个 孤儿 进程 组 
下 面 是 图 9-12 中 的 程序 的 输出 : 


$ ./a.out 

parent: pid = 6099, ppid = 2837, pgrp = 6099, tpgrp = 6099 
child: pid = 6100, ppid = 6099, pgrp = 6099, tpgrp = 6099 
$ SIGHUP received, pid = 6100 

child: pid = 6100, ppid = 1, pgrp = 6099, tpgrp = 2837 
read error 5 on controlling TTY 


注意 ， 因 为 两 个 进程 ， 登 录 shell 和 子 进程 都 写 向 终端 ， 所 以 shell 提示 符 和 子 进程 的 输出 一 
起 出 现 。 正 如 我 们 所 期 望 的 那样 ， 子 进程 的 父 进程 ID 变 成 1。 

在 子 进 程 中 调用 pr_ids 后 ， 程 序 企图 读 标准 输入 。 如 前 所 述 ， 当 后 台 进 程 组 试图 读 控制 终 
端 时 ， 对 该 后 台 进 程 组 产生 SIGTTIN。 但 在 这 里 ， 这 是 一 个 孤儿 进程 组 ， 如 果 内 核 用 此 信和 号 停止 
它 , 则 此 进程 组 中 的 进程 就 再 也 不 会 继续 。POSIX.1 规定 , read 返回 出 错 , 其 errno 设置 为 EIO 
(在 本 书 所 用 的 系统 中 其 值 是 5)。 

最 后 ， 要 注意 的 是 父 进程 终止 时 ， 子 进程 变 成 后 台 进程 组 ， 因 为 父 进 程 是 由 shell 作为 前 台 作 


业 执 行 的 。 E 
309 在 19.5 节 的 pty 程序 中 将 会 看 到 孤儿 进程 组 的 男 一 个 例子 。 
9.11 FreeBSD 实现 


前 面 说 明了 进程 、 进 程 组 、 会 话 和 控制 终端 的 各 种 属性 ， 值 得 观察 一 下 所 有 这 些 是 如 何 实现 
的 。 下 面 简要 说 明 FreeBSD 中 的 实现 。SVR4 实现 的 某 些 详细 情况 则 请 参阅 Williams[1989]。 
图 9-13 显示 了 FreeBSD 使 用 的 各 种 有 关 数 据 结构 。 
下 面 从 session 结构 开始 说 明 图 中 标 出 的 各 个 字段 ,每 个 会 话 都 分 配 一 个 session 结构 ( 例 
如 ， 每 次 调用 setsid 时 )。 
310 e s count 是 该 会 话 中 的 进程 组 数 。 当 此 计数 器 减 至 0 时 ， 则 可 释放 此 结构 。 
e s leader 是 指向 会 话 首 进程 proc 结构 的 指针 。 
e s ttyvp 是 指向 控制 终端 vnode 结构 的 指针 。 
e s ttyp 是 指向 控制 终端 tty 结构 的 指针 。 
e s_sid 是 会 话 ID。 请 记 住 会 话 ID 这 一 概念 并 非 Single UNIX Specification 的 组 成 部 分 。 
在 调用 setsid 时 , 在 内 核 中 分 配 一 个 新 的 session 结构 。s_count 设置 为 1, s leader 
设置 为 调用 进程 proc 结构 的 指针 ，s_siq 设置 为 进程 ID， 因 为 新 会 话 没有 控制 终端 ， 所 以 
s ttyvp 和 s_ttyp 设置 为 空 指针 。 
接着 说 明 tty 结构 。 每 个 终端 设备 和 每 个 伪 终 端 设备 均 在 内 核 中 分 配 这 样 一 种 结构 〈 第 19 
章 将 对 伪 终 端 做 更 多 说 明 )。 
e t session 指向 将 此 终端 作为 控制 终端 的 session 结构 (注意 ,tty 结构 指向 session 
£M], session 结构 也 指向 tty 结构 )。 终 端 在 失去 载波 信号 时 使 用 此 指针 将 挂 起 信号 
发 送 给 会 话 首 进程 〈 见 图 9-7)。 
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图 9-13 会话 和 进程 组 的 FreeBSD 实现 

e t_porp 指向 前 台 进 程 组 的 pgrp 结构 。 终 端 驱动 程序 用 此 字段 将 信和 号 发 送 给 前 台 进 程 组 。 
由 输入 特殊 字符 (中 断 、 退 出 和 挂 起 ) 而 产生 的 3 个 信号 被 发 送 至 前 台 进 程 组 。 

e t termios 是 包含 所 有 这 些 特殊 字符 和 与 该 终端 有 关 信息 (如 波 特 率 、 回 显 打开 或 关闭 
等 ) 的 结构 。 第 18 章 将 再 说 明 此 结构 。 

e t winsize 是 包含 终端 窗口 当前 大 小 的 winsize 型 结构 。 当 终端 窗口 大 小 改变 时 ， 信 
号 SIGWINCH 被 发 送 至 前 台 进 程 组 。18.12 节 将 说 明 如 何 设置 和 获取 终端 当前 窗口 大 小 。 

为 了 找到 特定 会 话 的 前 台 进 程 组 ， 内 核 从 session 结构 开始 ， 然 后 用 s_ttyp 得 到 控制 终 

端的 tty 结构 ， 再 用 t_pgrp 得 到 前 台 进 程 组 的 pgrp 结构 。 

pgrp 结构 包含 一 个 特定 进程 组 的 信息 。 其 中 各 相关 字段 具体 如 下 。 

e pg_id 是 进程 组 ID. 

e pg session 指向 此 进程 组 所 属 会 话 的 session 结构 。 

。 pg members 是 指向 此 进程 组 proc 结构 表 的 指针 ， 该 proc 结构 代表 进程 组 的 成 员 。 
proc 结构 中 p pglist 结构 是 双向 链表 , 指向 该 组 中 的 下 一 个 进程 和 上 一 个 进程 。 直 到 
遇 到 进程 组 中 的 最 后 一 个 进程 ， 它 的 proc 结构 中 p pglist 结构 为 空 指针 。 311 

proc 结构 包含 一 个 进程 的 所 有 信息 。 

e p pid 包含 进程 ID。 
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e p pptr 是 指向 父 进程 proc 结构 的 指针 。 

。 p pgrp 指向 本 进程 所 属 的 进程 组 的 pgrp 结构 的 指针 。 

* p_pglist 是 一 个 结构 ， 其 中 包含 两 个 指针 ， 分 别 指向 进程 组 中 上 一 个 和 下 一 个 进程 。 

最 后 还 有 一 个 vnode 结构 ,如 前 所 述 ,在 打开 控制 终端 设备 时 分 配 此 结构 。 进 程 对 /dev/tty 
的 所 有 访问 都 通过 vnode 结构 。 


9.12 小 结 


本 章 说 明了 进程 组 之 间 的 关系 一 一 会 话 , 它 由 若干 个 进程 组 组 成 。 作 业 控 制 是 当今 很 多 UNIX 
系统 所 支持 的 功能 ， 本 章 说 明了 它 是 如 何 由 支持 作业 控制 的 shell 实现 的 。 在 这 些 进 程 关 系 中 也 涉 
及 了 进程 的 控制 终端 /dev/tty。 

所 有 这 些 进程 的 关系 都 使 用 了 很 多 信号 方面 的 功能 ,下 一 章 将 详细 讨论 UNIX 中 的 信号 机 制 。 


习题 


9.1 ”考虑 6.8 节 中 说 明 的 utmp 和 wtmp 文件 ， 为 什么 logout 记录 是 由 init 进程 写 的 ? 对 于 
网 络 登录 的 处 理 与 此 相同 吗 ? 

92 ”编写 一 段 程序 调用 fork 并 使 子 进程 建立 一 个 新 的 会 话 。 验 证 子 进 程 变 成 了 进程 组 组 长 且 不 
再 有 控制 终端 。 


第 10 2€ 





10.1 引言 


信号 是 软件 中 断 。 很 多 比较 重要 的 应 用 程序 都 需 处 理 信 号 。 信 和 号 提供 了 一 种 处 理 异 步 事 件 的 
方法 ， 例 如 ， 终 端 用 户 键入 中 断 键 ， 会 通过 信和 号 机 制 停止 一 个 程序 ， 或 及 早 终 止 管道 中 的 下 一 个 
程序 。 

UNIX 系统 的 早期 版 本 就 已 经 提供 信号 机 制 ， 但 是 这 些 系统 (如 V7) 所 提供 的 信号 模型 并 不 
可 靠 。 信 号 可 能 丢失 ， 而 且 在 执行 临界 区 代码 时 ， 进 程 很 难关 闭 所 选择 的 信号 。4.3BSD 和 SVR3 
对 信号 模型 都 做 了 更 改 ， 增 加 了 可 靠 信号 机 制 。 但 是 Berkeley 和 AT&T 所 做 的 更 改 之 间 并 不 兼容 。 
幸运 的 是 ，POSIX.1 对 可 靠 信号 例 程 进行 了 标准 化 ， 这 正 是 本 章 所 要 说 明 的 。 

本 章 先 对 信和 号 机 制 进行 综述 ， 并 说 明 每 种 信号 的 一 般 用 法 。 然 后 分 析 早 期 实现 的 问题 。 在 分 
析 存 在 的 问题 之 后 再 说 明 解决 这 些 问题 的 方法 ， 这 种 安排 有 助 于 加 深 对 改进 机 制 的 理解 。 本 章 也 
包含 了 很 多 并 非 完 全 正确 的 实例 ， 这 样 做 的 目的 是 为 了 对 其 不 足 之 处 进行 讨论 。 


10.2 信号 概念 


首先 ， 每 个 信号 都 有 一 个 名 字 。 这 些 名 字 都 以 3 个 字符 SIG 开头 。 例 如 ，SIGRABRT 是 天 折 
信号 ， 当 进程 调用 abort 函数 时 产生 这 种 信号 。SIGALRM 是 闹钟 信号 ， 由 alarm 函数 设置 的 定 
时 器 超时 后 将 产生 此 信号 。V7 有 15 种 不 同 的 信号 ，SVR4 和 4.4BSD IA 31 种 不 同 的 信号。 
FreeBSD 8.0 支持 32 种 信号 ，Mac OS X 10.6.8 以 及 Linux 3.2.0 都 支持 31 种 信号 ， 而 Solaris 10 
支持 40 种 信号 。 但 是 ，FreeBSD、Linux 和 Solaris 作为 实时 扩展 都 支持 另外 的 应 用 程序 定义 的 信 
写 。 昌 然 本 书 不 包括 POSIX 实时 扩展 (有 关 信 息 请 参阅 Gallmeister[1995])， 但 是 SUSv4 已 经 把 
实时 信号 接口 移 至 基础 规范 说 明 中 。 

在 头 文件 <signal .h> 中 ， 信 号 名 都 被 定义 为 正 整 数 常量 (信号 编号 )。 

实际 上 ， 实 现 将 各 信号 定义 在 另 一 个 头 文件 中 ， 但 是 该 头 文件 又 包括 在 <signal.h> 中 。 内 核 包 
括 对 用 户 级 应 用 程序 有 意义 的 头 文件 ， 这 被 认为 是 一 种 不 好 的 形式 ， 所 以 如 若 应 用 程序 和 内 核 两 者 都 
需 使 用 同一 定义 ， 那 么 就 将 有 关 信息 放置 在 内 核 头 文件 中 ， 然 后 用 户 级 头 文件 再 包括 该 内 核 头 文件 。 
于 是 ，FreeBSD 8.0 # Mac OS X 10.6.8 将 信号 定义 在 <sys/signal.h> 中 ，Linux 3.2.0 将 信号 定义 在 
<bits/signum.h> 中 ，Solaris 10 将 信号 定义 在 <sys/iso/signal iso.h> 中 。 


不 存在 编号 为 0 的 信号 。 在 109 节 中 将 会 看 到 ，ki11 函数 对 信号 编号 0 有 特殊 的 应 用 。 
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POSIX.1 将 此 种 信号 编号 值 称 为 空 信号 。 

很 多 条 件 可 以 产生 信和 号 。 

。 当 用 户 按 某 些 终端 键 时 ， 引 发 终端 产生 的 信和 号。 在 终端 上 按 Delete 键 (或 者 很 多 系统 中 
的 Ctrl+C 键 ) 通常 产生 中 断 信 号 (SIGINT)。 这 是 停止 一 个 已 失去 控制 程序 的 方法 。( 第 
18 章 将 说 明 此 信号 可 被 映射 为 终端 上 的 任 一 字符 。) 

e 硬件 异常 产生 信号 : 除数 为 0、 无 效 的 内 存 引 用 等 。 这 些 条 件 通 常 由 硬件 检测 到 ， 并 通知 
内 核 。 然 后 内 核 为 该 条 件 发 生 时 正在 运行 的 进程 产生 适当 的 信号 。 例 如 ， 对 执行 一 个 无 
效 内 存 引 用 的 进程 产生 SIGSEGV 信号 。 

。 进程 调用 ki11(2) 函 数 可 将 任意 信号 发 送 给 男 一 个 进程 或 进程 组 。 自 然 ， 对 此 有 所 限制 : 
接收 信号 进程 和 发 送信 号 进程 的 所 有 者 必须 相同 ， 或 发 送信 号 进程 的 所 有 者 必须 是 超级 
用 户 。 

e 用 户 可 用 ki11(1) 命 令 将 信号 发 送 给 其 他 进程 。 此 命令 只 是 kill 函数 的 接口 。 常 用 此 命 
令 终 止 一 个 失控 的 后 台 进 程 。 

© 当 检 测 到 某 种 软件 条 件 已 经 发 生 ， 并 应 将 其 通知 有 关 进 程 时 也 产生 信号 。 这 里 指 的 不 是 
硬件 产生 条 件 〈 如 除 以 0)， 而 是 软件 条 件 。 例 如 SIGURG (在 网 络 连接 上 传 来 带 外 的 数 
据 )、SIGPIPE (在 管道 的 读 进程 已 终止 后 ， 一 个 进程 写 此 管道 ) 以 及 SIGALRM (进程 
所 设置 的 定时 器 已 经 超时 )。 

信和 号 是 异步 事件 的 经 典 实例 。 产 生 信号 的 事件 对 进程 而 言 是 随机 出 现 的 。 进 程 不 能 简单 地 测 
试 一 个 变量 〈 如 errno) 来 判断 是 否 发 生 了 一 个 信号 ， 而 是 必须 告诉 内 核 “ 在 此 信和 号 发 生 时 ， 请 

执行 下 列 操作 ”。 

在 某 个 信号 出 现时 ， 可 以 告诉 内 核 按 下 列 3 种 方式 之 一 进行 处 理 ， 我 们 称 之 为 信号 的 处 理 或 
与 信号 相关 的 动作 。 

(1) 忽略 此 信号 。 大 多 数 信号 都 可 使 用 这 种 方式 进行 处 理 ， 但 有 两 种 信号 却 决 不 能 被 忽略 。 
它们 是 SIGKILL 和 SIGSTOP。 这 两 种 信号 不 能 被 忽略 的 原因 是 : 它们 向 内 核 和 超级 用 户 提供 了 
使 进程 终止 或 停止 的 可 靠 方 法 。 男 外 ， 如 果 忽 略 某 些 由 硬件 异常 产生 的 信号 (如 非法 内 存 引 用 或 
除 以 0)， 则 进程 的 运行 行为 是 未 定义 的 。 

(2) 捕捉 信号 。 为 了 做 到 这 一 点 ， 要 通知 内 核 在 某 种 信号 发 生 时 ， 调 用 一 个 用 户 函 数 。 在 用 
户 函 数 中 ， 可 执行 用 户 希 望 对 这 种 事件 进行 的 处 理 。 例 如 ， 若 正在 编写 一 个 命令 解释 器 ， 它 将 用 
户 的 输入 解释 为 命令 并 执行 之 ， 当 用 户 用 键盘 产生 中 断 信号 时 ， 很 可 能 希望 该 命令 解释 器 返回 到 
主 循环 ， 终 止 正在 为 该 用 户 执行 的 命令 。 如 果 捕 捉 到 SIGCHLD 信号 ， 则 表示 一 个 子 进程 已 经 终 
止 ， 所 以 此 信和 号 的 捕捉 函数 可 以 调用 waitpid 以 取得 该 子 进程 的 进程 ID 以 及 它 的 终止 状态 。 又 
例如 ， 如 果 进 程 创 建 了 临时 文件 ， 那 么 可 能 要 为 SIGTERM 信号 编写 一 个 信号 捕捉 函数 以 清除 临 
时 文件 (SIGTERM 是 终止 信号 ，ki11 命令 传送 的 系统 默认 信和 号 是 终止 信号 )。 注 意 ， 不 能 捕捉 
SIGKILL 和 SIGSTOP 信和 号。 

(3) 执行 系统 默认 动作 。 图 10-1 给 出 了 对 每 一 种 信号 的 系统 默认 动作 。 注 意 ， 对 大 多 数 信 号 
的 系统 默认 动作 是 终止 该 进程 。 

图 10-1 列 出 了 所 有 信号 的 名 字 , 说 明了 哪些 系统 支持 此 信号 以 及 对 于 这 些 信 和 号 的 系统 默认 动 
作 。 在 SUS 列 中 ,“。” 表 示 此 种 信号 定义 为 基本 POSIX.1 规范 部 分 ,“XSI” 表 示 该 信号 定义 在 
XSI 扩展 部 分 。 

在 系统 默认 动作 列 ,“ 终 止 +fcore” 表 示 在 进程 当前 工作 目录 的 core 文件 中 复制 了 该 进程 的 内 
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存 映 像 (该 文件 名 为 core, 由 此 可 以 看 出 这 种 功能 很 久之 前 就 是 UNIX 的 一 部 分 )。 大 多 数 UNIX 
系统 调试 程序 都 使 用 core 文件 检查 进程 终止 时 的 状态 。 


ea Linux Mac OS os 


ISIGABRT | 异常 终止 labort) 
SIGALRM 定时 器 超时 (alarm) 
SIGBUS 硬件 故障 

SIGCANCEL | 线程 库 内 部 使 用 

SIGCHLD 子 进程 状态 改变 

SIGCONT i 

SIGEMT 

SIGFPE 

SIGFREEZE 

SIGHUP 

SIGILL 

SIGINFO 

SIGINT 

SIGIO 

SIGIOT 

SIGJVM1 

SIGJVM2 

SIGKILL 

SIGLOST 

SIGLWP 

SIGPIPE 写 至 无 读 进 程 的 管道 
SIGPOLL 可 轮 询 事 件 (poll) 
SIGPROP 梗概 时 间 超 时 (setitimer) 
SIGPWR 电源 失效 /重启 动 

SIGQUIT i 

SIGSEGV 

SIGSTKFLT 

SIGSTOP = 

SIGSYS 无 效 系统 调用 

SIGTERM 终止 

SIGTHAW 检查 点 解冻 

SIGTHR 线程 库 内 部 使 用 

SIGTRAP 硬件 故障 

SIGTSTP 终端 停止 符 

SIGTTIN 后 台 读 控制 tty 

SIGTTOU 后 台 写 向 控制 tty 

SIGURG 紧急 情况 〈 套 接 字 ) 
SIGUSR1 用 户 定义 信和 号 

SIGUSR2 用 户 定 义 信和 号 

SIGVTALRM | 虚拟 时 间 闹 钟 (setitimer) 
SIGWAITING | 线程 库 内 部 使 用 

SIGWINCH 终端 窗口 大 小 改变 
SIGXCPU 超过 CPU 限制 (setrlimit) 
SIGXFSZ 超过 文件 长 度 限制 (setrlimit) 终止 或 终止 core 
SIGXRES 超过 资源 控制 忽略 


图 10-1 UNIX 系统 信号 
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产生 core 文件 是 大 多 数 UNIX 系统 的 实现 功能 。 虽 然 该 功能 不 是 POSIX.1 的 组 成 部 分 ， 但 在 
Single UNIX Specification XSI 的 扩展 部 分 中 ， 这 一 功能 作为 一 个 潜在 的 特定 实现 的 动作 被 提 及 。 

在 不 同 的 实现 中 ，core 文件 的 名 字 可 能 不 同 。 例如， 在 FreeBSD 8.0 中 ，core 文件 名 为 
cmdname.core, XP cmdname 是 接收 到 信号 的 进程 所 执行 的 命令 名 。 在 Mac OS X 10.6.8 P, core 
文件 名 是 core.pid， 其 中 ，pid 是 接收 到 信号 的 进程 的 ID。( 这 些 系统 允许 经 sysctl 参数 配置 core 
文件 名 。 在 Linux 3.2.0 中 ，core 文件 名 通过 /proc/sys/kernel/core_pattern 进行 配置 。) 

大 多 数 实现 在 相应 进程 的 工作 目录 中 包含 core 文件 项 ; 但 Mac OS X 将 所 有 core 文件 都 放置 


在 /cores 


目录 中 。 


在 下 列 条 件 下 不 产生 core 文件 : (a) 进程 是 设置 用 户 ID 的 ， 而 且 当 前 用 户 并 非 程序 文件 的 
MAA: (b) 进程 是 设置 组 ID 的 , 而 且 当 前 用 户 并 非 该 程序 文件 的 组 所 有 者 ;〈c) 用 户 没 有 写 当 


前 工作 目录 的 权限 ; 


«D 文件 已 存在 ， 而 且 用 户 对 该 文件 设 有 写 权 限 ; Ce) 文件 太 大 (回忆 7.11 节 中 


的 RLIMIT_CORE 限制 )。core 文件 的 权限 (假定 该 文件 在 此 之 前 并 不 存在 ) 通常 是 用 户 读 / 写 ， 
但 Mac OS X 只 设置 为 用 户 读 。 
在 图 10-1 说 明 中 的 “硬件 故障 ”对 应 于 实现 定义 的 硬件 故障 。 这 些 名 字 中 有 很 多 取 自 UNIX 系统 
早先 在 PDP-11 上 的 实现 。 请 查看 你 所 使 用 系统 的 手册 ,以 确切 地 弄 清楚 这 些 信号 对 应 于 哪些 错误 类 型 。 
下 面 较 详 细 地 逐一 说 明 这 些 信号 。 


SIGABRT 
SIGALRM 


SIGBUS 


SIGCANCEL 
SIGCHLD 


SIGCONT 


SIGEMT 


调用 abort PART CUL 10.17 节 ) 产生 此 信和 号。 进程 异常 终止 。 

“Al alarm 函数 设置 的 定时 器 超时 时 ， 产 生 此 信和 号。 详细 情况 见 10.10 节 。 
若 由 setitimer(2) 函 数 设置 的 间隔 时 间 已 经 超时 时 ， 也 产生 此 信号 。 

指示 一 个 实现 定义 的 硬件 故障 。 当 出 现 某 些 类 型 的 内 存 故 障 时 (如 14.8 节 中 
说 明 的 )， 实 现 常常 产生 此 种 信号 。 

这 是 Solaris 线程 库 内 部 使 用 的 信号 。 它 不 适用 于 一 般 应 用 。 

在 一 个 进程 终止 或 停止 时 ，sIGCHLD 信号 被 送 给 其 父 进程 。 按 系统 默认 ， 将 忽 
略 此 信和 号。 如 果 父 进程 希望 被 告知 其 子 进程 的 这 种 状态 改变 ， 则 应 捕捉 此 信和 号 。 
信和 号 捕捉 函数 中 通常 要 调用 一 种 wait 函数 以 取得 子 进 程 ID 和 其 终止 状态 。 
System V 的 早期 版 本 有 一 个 名 为 SIGCLD (无 日) 的 类 似 信号 。 这 一 信号 具有 
与 其 他 信号 不 同 的 语义 , SVR2 的 手册 页 警告 在 新 的 程序 中 尽量 不 要 使 用 这 种 
信号 。( 令 人 奇怪 的 是 , 在 SVR3 和 SVR4 版 的 手册 页 中 ， 该 警告 消失 了 。) 应 
用 程序 应 当 使 用 标准 的 SIGCHLD 信号 ， 但 应 了 解 ， 为 了 向 后 兼容 ， 很 多 系统 
定义 了 与 SIGCHLD 等 同 的 SIGCLD。 如 果 有 使 用 SIGCLD 的 软件 ， 需 要 查阅 
系统 手册 ， 了 解 它 具体 的 语义 。10.7 节 将 讨论 这 两 个 信号 。 

此 作业 控制 信号 发 送 给 需要 继续 运行 ， 但 当前 处 于 停止 状态 的 进程 。 如 果 接 
收 到 此 信号 的 进程 处 于 停止 状态 ， 则 系统 默认 动作 是 使 该 进程 继续 运行 ， 否 
则 默认 动作 是 忽略 此 信号 。 例 如 ， 全 屏 编 辑 程序 在 捕捉 到 此 信号 后 ， 使 用 信 
号 处 理 程序 发 出 重新 绘制 终端 屏幕 的 通知 。 关 于 进一步 的 情况 见 10.21 节 。 
指示 一 个 实现 定义 的 硬件 故障 。 


EMT 这 一 名 字 来 自 PDP-11 的 仿真 器 陷入 ( emulator trap ) 指令 。 并 非 所 有 平台 都 支持 此 


信号 。 


例如 ，Linux 只 对 SPARC、MIPS 和 PA_RISC 等 系统 结构 支持 SIGEMT。 
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SIGFPE 此 信和 号 表示 一 个 算术 运算 异常 ， 如 除 以 0、 浮 点 溢出 等 。 

SIGFREEZE 此 信号 仅 由 Solaris 定义 。 它 用 于 通知 进程 在 冻结 系统 状态 之 前 需要 采取 特定 
动作 ， 例 如 当 系 统 进 入 休眠 或 挂 起 状态 时 可 能 需要 做 这 种 处 理 。 

SIGHUP 如 果 终 端 接口 检测 到 一 个 连接 断 开 ， 则 将 此 信号 送 给 与 该 终端 相关 的 控制 进程 
(会 话 首 进程 )。 见 图 9-13， 此 信和 号 被 送 给 session 结构 中 s leader 字段 所 
指向 的 进程 。 仅 当 终 端的 CLOCAL 标志 没有 设置 时 ， 在 上 述 条 件 下 才 产 生 此 信 
号 。( 如 果 所 连接 的 终端 是 本 地 的 ， 则 设置 该 终端 的 CLOCAL 标志 。 它 告诉 终端 
驱动 程序 忽略 所 有 调制 解 调 器 的 状态 行 。 第 18 章 将 说 明 如 何 设置 此 标志 。) 
注意 ， 接 到 此 信号 的 会 话 首 进程 可 能 在 后 台 ， 作 为 一 个 例子 ， 请 参见 图 9-7。 
这 区 别 于 由 终端 正常 产生 的 几 个 信号 〈 中 断 、 退 出 和 挂 起 )， 这 些 信和 号 总 是 传 


递 给 前 台 进 程 组 。 
如 果 会 话 首 进程 终止 ， 也 产生 此 信号 。 在 这 种 情况 ， 此 信号 送 给 前 台 进程 组 
中 的 每 一 个 进程 。 


通常 用 此 信和 号 通知 守护 进程 ( 见 第 13 章 ) 再 次 读 取 它们 的 配置 文件 。 选用 SIGHUP 
的 理由 是 ， 守 护 进程 不 会 有 控制 终端 ， 通 常 决 不 会 接收 到 这 种 信和 号。 
SIGIDL 此 信号 表示 进程 已 执行 一 条 非法 硬件 指令 。 
4.3BSD 的 abort 函数 产生 此 信号 。 现 在 该 函数 产生 SIGABRT 信号 。 


SIGINFO 这 是 一 种 BSD 信号 ， 当 用 户 按 状 态 键 (一 般 采 用 Ctrl+T) 时 ， 终 端 驱动 程序 
产生 此 信号 并 发 送 至 前 台 进 程 组 中 的 每 一 个 进程 〈 见 图 9-9)。 此 信号 通常 造 
成 在 终端 上 显示 前 台 进 程 组 中 各 进程 的 状态 信息 。 
虽然 Alpha 平台 将 SIGINFO 定义 为 与 SIGPWR 具有 相同 值 ， 但 是 Linux 并 不 支持 SIGINFO 
信号 。 这 更 多 是 因为 需要 对 OSF/1 开发 的 软件 提供 某 种 程度 的 兼容 。 318 


SIGINT 当 用 户 按 中 断 键 ( 一 般 采 用 Delete 或 Ctrl+C) 时 ， 终 端 驱 动 程序 产生 此 信和 号 
并 发 送 至 前 台 进 程 组 中 的 每 一 个 进程 〈 见 图 9-9)。 当 一 个 进程 在 运行 时 失控 ， 
特别 是 它 正在 屏幕 上 产生 大 量 不 需要 的 输出 时 ， 常 用 此 信号 终止 它 。 

SIGIO 此 信号 指示 一 个 异步 IO 事件 。 在 14.5.2 节 中 将 对 此 进行 讨论 。 

在 图 10-1 中 ， 对 SIGIO 的 系统 默认 动作 是 终止 或 忽略 。 遗 憾 的 是 ， 这 依赖 于 系统 。 在 
System V 中 ，SIGIO 5 SIGPOLL 相同 ， 其 默认 动作 是 终止 此 进程 。 在 BSD 中 ， 其 默认 动 
作 是 忽略 此 信号 。 

Linux 3.2.0 和 Solaris 10 将 SIGIO 定义 为 与 SIGPOLL 具有 相同 值 ， 所 以 默认 行为 是 终 
止 该 进程 。 在 FreeBSD 8.0 和 Mac OS X 10.6.8 中 ， 默 认 行 为 是 忽略 该 信号 。 


SIGIOT 这 指示 一 个 实现 定义 的 硬件 故障 。 


IOT 这 个 名 字 来 自 于 PDP-11， 它 是 PDP-11 计算 机 “输入 /输出 TRAP”( input/output TRAP ) 指 
令 的 缩写 。System V 的 早期 版 本 ， 由 abort 函数 产生 此 信和 号。 该 函数 现在 产生 SIGABRT 信号 。 

FreeBSD 8.0, Linux 3.2.0, Mac OS X 10.6.8 和 Solaris 10 将 SIGIOT 定义 为 与 SIGABRT 
具 相 同 值 。 


SIGJVM1 Solaris 上 为 Java 虚拟 机 预 留 的 一 个 信号。 
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SIGJVM2 
SIGKILL 


SIGLOST 


SIGLWP 


SIGPIPE 


SIGPOLL 





Solaris 上 为 Java 虚拟 机 预 留 的 另 一 个 信号 。 

这 是 两 个 不 能 被 捕 提 或 忽略 信号 中 的 一 个 。 它 向 系统 管理 员 提 供 了 一 种 可 以 
杀 死 任 一 进程 的 可 靠 方法 。 

运行 在 Solaris NFSv4 客户 端 系统 中 的 进程 ， 恢 复 阶 段 不 能 重新 获得 锁 ， 此 时 
将 由 这 个 信号 通知 该 进程 。 

此 信号 由 Solaris 线程 库 内 部 使 用 , 并 不 做 一 般 使 用 。 在 FreeBSD 中 ，SIGLWP 
是 SIGTHR 的 别名 。 

如 果 在 管道 的 读 进 程 已 终止 时 写 管道 ， 则 产生 此 信号 。15.2 节 将 说 明 管道 。 当 
类 型 为 SOCK_STREAM 的 套 接 字 已 不 再 连接 时 ， 进 程 写 该 套 接 字 也 产生 此 信 
号 。 我 们 将 在 第 16 章 说 明 套 接 字 。 

这 个 信号 在 SUSv4 中 已 被 标记 为 弃 用 ， 将 来 的 标准 可 能 会 将 此 信和 号 移 除 。 当 
在 一 个 可 轮 询 设 备 上 发 生 一 个 特定 事件 时 产生 此 信号 。14.4.2 节 将 说 明 poll 
函数 和 此 信号 ， 它 起 源 于 SVR3, 5 BSD 的 SIGIO 和 SIGURG 信号 接近 。 


在 Linux 和 Solaris 中 ，SIGPOLL 定义 为 与 SIGIO 具有 相同 值 。 


SIGPROF 


SIGPWR 


这 个 信号 在 SUSv4 中 已 被 标记 为 弃 用 ， 将 来 的 标准 可 能 会 将 此 信号 移 除 。 当 
setitimer(2) 函 数 设 置 的 梗概 统计 间隔 定时 器 (profiling interval timer) 已 经 
超时 时 产生 此 信和 号 。 

这 是 一 种 依赖 于 系统 的 信号 。 它 主要 用 于 具有 不 间断 电源 CUPS) 的 系统 。 如 
果 电 源 失效 ， 则 UPS 起 作用 ， 而 且 通 常 软 件 会 接 到 通知 。 在 这 种 情况 下 ， 系 
统 依靠 蓄电池 电源 继续 运行 ， 所 以 无 须 做 任何 处 理 。 但 是 如 果 蕾 电池 也 将 不 
能 支持 工作 ， 则 软件 通常 会 再 次 接 到 通知 ， 此 时 ， 系 统 必 项 使 其 各 部 分 都 停 
止 运行 。 这 时 应 当 发 送 SIGPWR 信号 。 在 大 多 数 系统 中 ， 接 到 蓄电池 电压 过 
低 信息 的 进程 将 信号 SIGPWR 发 送 给 init 进程 ,然后 由 init 处 理 停机 操作 。 


Solaris 10 和 有 些 Linux 版 本 在 inittab 文件 中 有 两 个 记录 项 用 于 此 种 目的 : powerfail 
以 及 powerwait (3 powerokwait )。 

在 图 10-1 中 ,我 们 将 SIGPWR 的 默认 动作 标记 为 “终止 或 忽略 "。 遗 憾 的 是 ， 这 种 默认 动 
作 依 赖 于 系统 。Linux 对 此 的 默认 动作 是 终止 相关 进程 ， 而 Solaris 的 默认 动作 是 忽略 该 信号 。 


SIGQUIT 


SIGSEGV 


当 用 户 在 终端 上 按 退 出 键 〈 一 般 采 用 Crh) 时 ， 中 断 驱 动 程序 产生 此 信号， 
并 发 送 给 前 台 进 程 组 中 的 所 有 进程 ( 见 图 9-9)。 此 信和 号 不 仅 终 止 前 台 进 程 组 
(如 SIGINT 所 做 的 那样 )， 同 时 产生 一 个 core 文件 。 

指示 进程 进行 了 一 次 无 效 的 内 存 引 用 (通常 说 明 程 序 有 错 ， 比 如 访问 了 一 个 
未 经 初始 化 的 指针 )。 


名 字 SEGV 代表 “ 段 违例 ”( segmentation violation ). 


SIGSTKFLT 


SIGSTOP 


SIGSYS 


此 信号 仅 由 Linux 定义 。 它 出 现在 Linux 的 早期 版 本 ， 企 图 用 于 数学 协 处 理 器 
的 栈 故 障 。 该 信号 并 非 由 内 核 产生 ， 但 仍 保留 以 向 后 兼容 。 

这 是 一 个 作业 控制 信号 ， 它 停止 一 个 进程 。 它 类 似 于 交互 停止 信和 号 (SIGTSTP), 
但 是 SIGSTOP 不 能 被 捕 提 或 忽略 。 

该 信号 指示 一 个 无 效 的 系统 调用 。 由 于 某 种 未 知 原因 ， 进 程 执行 了 一 条 机 器 
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指令 ， 内 核 认 为 这 是 一 条 系统 调用 ， 但 该 指令 指示 系统 调用 类 型 的 参数 却 是 
无 效 的 。 这 种 情况 是 可 能 发 生 的 ， 例 如 ， 若 用 户 编 写 了 一 道 使 用 新 系统 调用 
的 程序 ， 然 后 运行 该 程序 的 二 进 制 可 执行 代码 ， 而 所 用 的 操作 系统 却 是 不 支 
持 该 系统 调用 的 较 早 版 本 ， 于 是 就 出 现 上 述 情况 。 

SIGTERM 这 是 由 ki11(1) 命 令 发 送 的 系统 默认 终止 信号 。 由 于 该 信号 是 由 应 用 程序 捕获 
的 ,使 用 SIGTERM 也 让 程序 有 机 会 在 退出 之 前 做 好 清理 工作 ， 从 而 优雅 地 终 
ik (相对 于 SIGKILL MG. SIGKILL 不 能 被 捕捉 或 者 忽略 )。 

SIGTHAW 此 信号 仅 由 Solaris 定义 。 在 被 挂 起 的 系统 恢复 时 ， 该 信号 用 于 通知 相关 进程 ， 
它们 需要 采取 特定 的 动作 。 

SIGTHR FreeBSD 线程 库 预 留 的 信号 ， 它 的 值 定 义 或 与 SIGLWP 相同 。 

SIGTRAP 指示 一 个 实现 定义 的 硬件 故障 。 


此 信号 名 来 自 于 PDP-11 的 TRAP 指令 。 当 执行 断 点 指令 时 ， 实 现 常用 此 信号 将 控制 转 
| 移 至 调试 程序 。 
SIGTSTP 交互 停止 信号 ， 当 用 户 在 终端 上 按 挂 起 键 〈 一 般 采 用 Ctrl+Z) 时 ， 终 端 驱动 
程序 产生 此 信和 号。 该 信号 发 送 至 前 台 进 程 组 中 的 所 有 进程 〈 人 参见 图 9-9 )。 
遗憾 的 是 , 停止 具有 不 同 的 含义 。 当 讨论 作业 控制 和 信号 时 ,我们 谈 及 停止 和 继续 作业 。 
但 是 ， 终 端 驱动 程序 一 直 使 用 术语 “停止 ”表示 用 Ctrl+S 字符 终止 终端 输出 ， 为 了 继续 启动 
该 终端 输出 , 则 用 Ctrl+Q 字符 。 为 此 , 终端 驱动 程序 称 产 生 交 互 停止 信号 的 字符 为 挂 起 字符 ， 
而 非 停止 字符 。 


SIGTTIN 当 一 个 后 台 进 程 组 进程 试图 读 其 控制 终端 时 ， 终 端 驱 动 程序 产生 此 信和 号 〈 见 
9.8 节 中 对 此 问题 的 讨论 )。 在 下 列 例外 情形 下 不 产生 此 信和 号: (a) 读 进 程 忽略 
或 阻塞 此 信号 ; (b) 读 进 程 所 属 的 进程 组 是 孤儿 进程 组 ， 此 时 读 操作 返回 出 
错 ，errno 设置 为 EIO。 

SIGTTOU 当 一 个 后 台 进 程 组 进程 试图 写 其 控制 终端 时 ， 终 端 驱动 程序 产生 此 信号 ( 见 
9.8 节 对 此 问题 的 讨论 )。 与 上 面 所 述 的 SIGTTIN fa SAA, 一 个 进程 可 以 选 
择 允 许 后 台 进 程 写 控 制 终端 。 第 18 章 将 讨论 如 何 更 改 此 选项 。 
如 果 不 允 许 后 台 进程 写 ， 则 与 SIGTTIN 相似 ， 也 有 两 种 特殊 情况 : (a) ‘Sit 
程 忽 略 或 阻塞 此 信号 ; (b) 写 进程 所 属 进程 组 是 孤儿 进程 组 。 在 第 2 种 情况 下 
不 产生 此 信号 ， 写 操作 返回 出 错 ，errno 设置 为 EIO。 
不 论 是 否 允许 后 台 进 程 写 ， 一 些 除 写 以 外 的 下 列 终 端 操作 也 能 产生 SIGTTOU 
信和 号， 如 tcsetattr、tcsendbreak、tcdrain、tcflush、tcflow 以 
及 tcsetpgrp。 第 18 章 将 说 明 这 些 终端 操作 。 

SIGURG 此 信号 通知 进程 已 经 发 生 一 个 紧急 情况 。 在 网 络 连 接 上 接 到 带 外 的 数据 时 ， 
可 选择 地 产生 此 信号 。 

SIGUSR1 这 是 一 个 用 户 定义 的 信号 ， 可 用 于 应 用 程序 。 

SIGUSR2 这 是 另 一 个 用 户 定义 的 信号 ， 与 SIGUSR1 相似 ， 可 用 于 应 用 程序 。 

SIGVTALRM ” 当 一 个 由 setitimer(2) 函 数 设置 的 虚拟 间隔 时 间 已 经 超时 时 ， 产 生 此 信和 号 。 

SIGWAITING 此 信号 由 Solaris 线程 库 内 部 使 用 ， 不 做 他 用 。 
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SIGWINCH ”内核 维持 与 每 个 终端 或 伪 终 端 相 关联 窗口 的 大 小 。 进程 可 以 用 ioctl 函数 ( 见 
18.12 节 ) 得 到 或 设置 窗口 的 大 小 。 如 果 进 程 用 ioctl 的 设置 窗口 大 小 命令 
更 改 了 窗口 大 小 ， 则 内 核 将 SIGWINCH 信号 发 送 至 前 台 进 程 组 。 
SIGXCPU Single UNIX Specification 的 XSI 扩展 支持 资源 限制 的 概念 ( 见 7.11 节 )。 如 果 
进程 超过 了 其 软 CPU 时 间 限 制 ， 则 产生 此 信号。 
在 图 10-1 中 ， 对 于 SIGXCPU 的 默认 动作 说 明 为 “终止 或 终止 +core"。 该 默认 动作 依赖 
于 操作 系统 。Linux 3.2.0 和 Solaris 10 支持 的 默认 动作 是 终止 并 创建 core 文件 ; FreeBSD 8.0 
和 Mac OS X 10.6.8 支持 的 默认 动作 是 终止 且 不 产生 core 文件 。Single UNIX Specification 要 
求 该 默认 动作 是 ， 异 常 终止 该 进程 ， 是 否 创 建 core 文件 则 留 给 实现 决定 。 


SIGXFSZ 如 果 进 程 超过 了 其 软文 件 长 度 限 制 ( 见 7.11 节 )， 则 产生 此 信和 号 。 
如 同 SIGXCPU 一 样 , 针对 SIGXFSZ 的 默认 动作 依赖 于 操作 系统 。Linux 3.2.0 和 Solaris 
10 对 此 信号 的 默认 动作 是 终止 并 创建 core 文件 。FreeBSD 8.0 和 Mac OS X 10.6.8 支持 的 默 
认 动 作 是 终止 且 不 产生 core 文件 。Single UNIX Specification 要 求 该 默认 动作 是 异常 终止 该 进 
程 ， 是 否 创 建 core 文件 则 留 给 实现 决定 。 
SIGXRES 此 信号 仅 由 Solaris 定义 。 可 选择 地 使 用 此 信和 号 以 通知 进程 超过 了 预 配置 的 资源 值 。 
Solaris 资源 限制 机 制 是 一 种 通用 设施 ,用 于 控制 在 独立 应 用 集 之 间 共 享 资源 的 使 用 。 
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UNIX 系统 信号 机 制 最 简单 的 接口 是 signal 函数 。 


#include <signal.h> 


void (*signal(int signo, void (*func) (int))) (int); 


返回 值 ， 若 成 功 ， 返 回 以 前 的 信号 处 理 配 置 ， 着 出 错 ， 返 回 SIG ERR 





signal 函数 由 ISO C 定义 。 因 为 ISO C 不 涉及 多 进程 、 进 程 组 以 及 终端 lO 等 ， 所 以 它 对 
信号 的 定义 非常 含糊 ， 以 致 于 对 UNIX 系统 而 言 几 乎 毫 无 用 处 。 

从 UNIX System V 派生 的 实现 支持 signal 函数 ， 但 该 函数 提供 旧 的 不 可 靠 信号 语义 ( 10.4 
节 将 说 明 这 些 旧 的 语义 ), 提供 此 函数 主要 是 为 了 向 后 兼容 要 求 此 旧 语 义 的 应 用 程序 ,新 应 用 程序 
不 应 使 用 这 些 不 可 靠 信 号 。 

4.4BSD 也 提供 signal 函数 ， 但 它 是 按照 sigaction 函数 定义 的 (10.14 节 将 说 明 
sigaction 函数 )， 所 以 在 4.4BSD 之 下 使 用 它 提供 新 的 可 靠 信号 语义 。 目 前 大 多 数 系统 遵循 这 
种 策略 ， 但 Solaris 10 沿用 System V signal 函数 的 语义 。 

AA signal 的 语义 与 实现 有 关 ,所 以 最 好 使 用 sigaction 函数 代替 signal 函数 。 在 10.14 
节 讨 论 sigaction 函数 时 ， 提 供 了 使 用 该 函数 的 signal 的 一 个 实现 。 本 书 中 的 所 有 实例 均 使 
用 图 10-18 中 给 出 的 signal 函数 ， 这 样 不 管 使 用 何 种 平台 都 可 以 有 一 致 的 语义 。 

signo 参数 是 图 10-1 中 的 信号 名 。fiinc 的 值 是 常量 SIG_IGN、 常 量 SIG_DFL 或 当 接 到 此 信 


号 后 要 调用 的 函数 的 地 址 。 如 果 指 定 SIG_IGN， 则 向 内 核 表 示 忽 略 此 信号 ( 记 住 有 两 个 信号 SIGKILL 
和 SIGSTOP 不 能 忽略 )。 如果 指 定 SIG_DFL, 则 表示 接 到 此 信号 后 的 动作 是 系统 默认 动作 ( 见 图 10-1 
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中 的 最 后 一 列 )。 当 指定 函数 地 址 时 ， 则 在 信号 发 生 时 ， 调 用 该 函数 ， 我 们 称 这 种 处 理 为 捕捉 该 信号， 
称 此 函数 为 信号 处 理 程序 (signal handler) 或 信号 捕捉 函数 Csignal-catching function). 

signal 图 数 原型 说 明 此 函数 要 求 两 个 参数 ， 返 回 一 个 函数 指针 ， 而 该 指针 所 指向 的 函数 无 
返回 值 (void)。 第 一 个 参数 signo 是 一 个 整 型 数 ， 第 二 个 参数 是 函数 指针 ， 它 所 指向 的 函数 需 
要 一 个 整 型 参数 ， 无 返回 值 。signal 的 返回 值 是 一 个 函数 地 址 ， 该 函数 有 一 个 整 型 参数 (HR 
后 的 (int) )。 用 自然 语言 来 描述 也 就 是 要 向 信号 处 理 程序 传送 一 个 整 型 参数 ， 而 它 却 无 返回 值 。 
当 调 用 signal 设置 信号 处 理 程 序 时 , 第 二 个 参数 是 指向 该 函数 (也 就 是 信号 处 理 程序 ) 的 指针 。 
signal 的 返回 值 则 是 指向 在 此 之 前 的 信号 处 理 程序 的 指针 。 


很 多 系统 用 附加 的 依赖 于 实现 的 参数 来 调用 信号 处 理 程序 。10.14 节 将 对 此 做 进一步 说 明 。 

本 节 开 头 所 示 的 signal 函数 原型 太 复杂 了 ， 如 果 使 用 下 面 的 typedef[Plauger 1992]， 则 
可 使 其 简单 一 些 。 

typedef void Sigfunc(int); 
然后 ， 可 将 signal 函数 原型 写成 : 

Sigfunc *signal (int，Sigfunc *); 
我 们 已 将 此 typedef 包括 在 apue.n 文件 中 〈 见 附录 B)， 并 随 本 章 中 的 函数 一 起 使 用 。 

如 果 查 看 系统 的 头 文件 <signal.h>， 则 很 可 能 会 找到 下 列 形 式 的 声明 : 


#define SIG ERR (void (*)())-1 
#define SIG DFL (void (*)())0 
#define SIG IGN (void (*)(0())1 


这 些 常量 可 用 于 表示 “指向 函数 的 指针 ， 该 函数 要 求 一 个 整 型 参数 ， 而 且 无 返回 值 ”。signal 的 
第 二 个 参数 及 其 返回 值 就 可 用 它们 表示 。 这 些 常量 所 使 用 的 3 个 值 不 一 定 是 -1、0 和 1， 但 它们 
必须 是 3 个 值 而 决 不 能 是 任 一 函数 的 地 址 。 大 多 数 UNIX 系统 使 用 上 面 所 示 的 值 。 


s SP 


图 10-2 给 出 了 一 个 简单 的 信号 处 理 程序 , 它 捕捉 两 个 用 户 定义 的 信号 并 打印 信和 号 编号 。10.10 
节 将 说 明 pause 函数 ， 它 使 调用 进程 在 接 到 一 信号 前 挂 起 。 


#include "apue.h" 





static void sig usr(int); /* one handler for both signals */ 


int 
main(void) 


( 


if (signal(SIGUSR1, sig usr) == SIG ERR) 
err sys("can't catch SIGUSRI"); 

if (signal(SIGUSR2, sig usr) -- SIG ERR) 
err sys("can't catch SIGUSR2"); 

for C £35.) 
pause (); 


) 


static void 
sig usr(int signo) /* argument is signal number */ 
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if (signo == SIGUSR1) 
printf ("received SIGUSR1\n") ; 
else if (signo == SIGUSR2) 
printf ("received SIGUSR2\n") ; 
else 
err_dump("received signal %d\n", signo); 


图 10-2 捕捉 SIGUSR1 和 SIGUSR2 的 简单 程序 
我 们 使 该 程序 在 后 台 运 行 ， 并 且 用 ki11(1) 命 令 将 信号 发 送 给 它 。 注 意 ， 在 UNIX 系统 中 ， 
A (kill) 这 个 术语 是 不 恰当 的 。kil11(D) 命 令 和 ki11(2) 函 数 只 是 将 一 个 信号 发 送 给 一 个 进程 
或 进程 组 。 该 信号 是 否 终止 进程 则 取决 于 该 信号 的 类 型 ， 以 及 进程 是 否 安排 了 捕捉 该 信和 号。 


$ ./a.out & 在 后 台 启 动 进 程 

[1] 7216 作业 控制 shell 打印 作业 编号 和 进程 ID 

$ kill -USR1 7216 向 该 进程 发 送 SIGUSR1 

received SIGUSR1 

$ kill -USR2 7216 向 该 进程 发 送 STGUSR2 

received SIGUSR2 

$ kill 7216 向 该 进程 发 送 SIGTERM 

[1]+ Terminated ./a.out 

因为 执行 图 10-2 程序 的 进程 不 捕捉 SIGTERM 信和 号， 而 对 该 信号 的 系统 默认 动作 是 终止 ,所 
以 当 向 该 进程 发 送 SIGTERM 信号 后 ， 该 进程 就 终止 。 

1. 程序 启动 


当 执行 一 个 程序 时 ， 所 有 信和 号 的 状态 都 是 系统 默认 或 忽略 。 通 常 所 有 信号 都 被 设置 为 它们 的 默 
认 动 作 ， 除 非 调 用 exec 的 进程 忽略 该 信号 。 确 切 地 讲 ，exec 函数 将 原先 设置 为 要 捕捉 的 信号 都 
更 改 为 默认 动作 ， 其 他 信号 的 状态 则 不 变 〈 一 个 进程 原先 要 捕捉 的 信号 ， 当 其 执行 一 个 新 程序 后 ， 
就 不 能 再 捕捉 了 ， 因 为 信号 捕捉 函数 的 地 址 很 可 能 在 所 执行 的 新 程序 文件 中 已 无 意义 )。 

一 个 具体 例子 是 一 个 交互 shell 如 何 处 理 针对 后 台 进 程 的 中 断 和 退出 信号 。 对 于 一 个 非 作业 控 
‘fil shell， 当 在 后 台 执 行 一 个 进程 时 ， 例 如 : 

cc main.c & 
shell 自动 将 后 台 进 程 对 中 断 和 退出 信号 的 处 理 方式 设置 为 忽略 。 于 是 ， 当 按 下 中 断 字符 时 就 不 会 
影响 到 后 台 进 程 。 如 果 没有 做 这 样 的 处 理 ， 那 么 当 按 下 中 断 字符 时 ， 它 不 但 终止 前 台 进程 ， 也 终 
止 所 有 后 台 进 程 。 

很 多 捕捉 这 两 个 信号 的 交互 程序 具有 下 列 形式 的 代码 ; 


void sig int(int), sig quit(int); 


if (signal(SIGINT, SIG IGN) !- SIG IGN) 
signal(SIGINT, sig int); 
if (signal(SIGQUIT, SIG IGN) !- SIG IGN) 


Ssignal(SIGQUIT, sig quit); 
这 样 处 理 后 ， 仅 当 SIGINT 和 SIGQUIT 当前 未 被 忽略 时 ， 进 程 才 会 捕捉 它们 。 
从 signal 的 这 两 个 调用 中 也 可 以 看 到 这 种 函数 的 限制 : 不 改变 信号 的 处 理 方式 就 不 能 确定 
信和 号 的 当前 处 理 方式 。 我 们 将 在 本 章 的 稍 后 部 分 说 明 使 用 sigaction 函数 可 以 确定 一 个 信号 的 
处 理 方式 ， 而 无 需 改 变 它 。 
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2. 进程 创建 
当 一 个 进程 调用 fork 时 ， 其 子 进程 继承 父 进 程 的 信号 处 理 方式 。 因 为 子 进程 在 开始 时 复制 
了 父 进 程 内 存 映像 ， 所 以 信号 捕捉 函数 的 地 址 在 子 进程 中 是 有 意义 的 。 


10.4 不 可 靠 的 信号 


在 早期 的 UNIX 版 本 中 (如 V7), 信和 号 是 不 可 靠 的 。 不 可 靠 在 这 里 指 的 是 , 信号 可 能 会 丢失 : 
一 个 信号 发 生 了 ， 但 进程 却 可 能 一 直 不 知道 这 一 点 。 同 时 ， 进 程 对 信号 的 控制 能 力也 很 差 ， 它 能 
捕捉 信号 或 忽略 它 。 有 时 用 户 希望 通知 内 核 阻 塞 某 个 信号 : 不 要 忽略 该 信号 , 在 其 发 生 时 记 住 它 ， 
然后 在 进程 做 好 了 准备 时 再 通知 它 。 这 种 阻塞 信号 的 能 力 当 时 并 不 具备 。 


4.2BSD 对 信号 机 制 进行 了 更 改 ， 提供 了 被 称 为 可 靠 信 号 的 机 制 。 然 后 ，SVR3 也 修改 了 信号 
机 制 ， 提 供 了 System V 可 靠 信 号 机 制 。POSIX.1 选择 了 BSD 模型 作为 其 标准 化 的 基础 。 


早期 版 本 中 的 一 个 问题 是 在 进程 每 次 接 到 信号 对 其 进行 处 理 时 ， 随 即将 该 信号 动作 重 置 为 默 
认 值 (在 前 面 运行 图 10-2 程序 时 ， 每 种 信号 只 捕 提 一 次 ， 从 而 回避 了 这 一 点 )。 在 描述 这 些 早 期 
系统 的 编程 书籍 中 ， 有 一 个 经 典 实例 ， 它 与 如 何 处 理 中 断 信号 相关 ， 其 代码 与 下 面 所 示 的 相似 : 


int sig_int(); /* my signal handling function */ 
signal(SIGINT, sig_int); /* establish handler */ 


sig int() 

{ 
signal(SIGINT, sig_int); /* reestablish handler for next time */ 
: /* process the signal ... */ 


} 
(由 于 早期 的 C 语言 版 本 不 支持 ISO C 的 void 数据 类 型 ， 所 以 将 信号 处 理 程序 声明 为 int 类 型 。) 
这 段 代码 的 一 个 问题 是 : 在 信号 发 生 之 后 到 信号 处 理 程序 调用 signal 函数 之 间 有 一 个 时 间 
窗口 。 在 此 段 时 间 中 ， 可 能 发 生 另 一 次 中 断 信 号 。 第 二 个 信号 会 造成 执行 默认 动作 ， 而 对 中 断 信 
号 的 默认 动作 是 终止 该 进程 。 这 种 类 型 的 程序 段 在 大 多 数 情况 下 会 正常 工作 ， 使 得 我 们 认为 它们 
是 正确 无 误 的 ， 而 实际 上 却 并 非 如 此 。 
这 些 早期 版 本 的 另 一 个 问题 是 : 在 进程 不 希望 某 种 信号 发 生 时 ， 它 不 能 关闭 该 信号 。 进 程 能 
做 的 一 切 就 是 忽略 该 信号 。 有 时 希望 通知 系统 “阻止 下 列 信号 发 生 ， 如 果 它 们 确实 产生 了 ， 请 记 
住 它们 。” 能 够 显现 这 种 缺陷 的 的 一 个 经 典 实例 是 下 列 程序 段 ， 它 捕捉 一 个 信号 ， 然 后 设置 一 个 
表示 该 信号 已 发 生 的 标志 : 


int sig_int(); /* my signal handling function */ 
int sig_int_flag; /* set nonzero when signal occurs */ 
main () 
{ 
signal(SIGINT, sig_int); /* establish handler */ 
while (sig_int_flag == 0) 
pause (); /* go to sleep, waiting for signal */ 


} 
sig_int() 
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{ 
signal (SIGINT, sig int); /* reestablish handler for next time */ 
sig int flag = 1; /* set flag for main loop to examine */ 
} 


其 中 ， 进 程 调用 pause 函数 使 自己 休眠 ， 直 到 捕捉 到 一 个 信号 。 当 捕捉 到 信号 时 ， 信 和 号 处 理 程 
序 将 标志 sig_int_flag 设置 为 非 0 值 。 从 信号 处 理 程序 返回 后 ， 内 核 自 动 将 该 进程 唤醒 ， 它 
检测 到 该 标志 为 非 0， 然 后 执行 它 所 需 做 的 。 但 是 这 里 有 一 个 时 间 窗 口 , 在 此 窗口 中 操作 可 能 失误 。 
如 果 在 测试 sig_int_flag 之 后 、 调 用 pause 之 前 发 生 信号 ， 则 此 进程 在 调用 pause 时 可 能 
将 永久 休眠 《假定 此 信和 号 不 会 再 次 产生 )。 于 是 ， 这 次 发 生 的 信号 也 就 丢失 了 。 这 是 另 一 个 例子 ， 
某 段 代码 并 不 正确 ， 但 是 大 多 数 时 间 却 能 正常 工作 。 要 查找 并 排除 这 种 类 型 的 问题 很 困难 。 


10.5 中断 的 系统 调用 


早期 UNIX 系统 的 一 个 特性 是 : 如 果 进 程 在 执行 一 个 低速 系统 调用 而 阻塞 期 间 捕捉 到 一 个 信 
号 ， 则 该 系统 调用 就 被 中 断 不 再 继续 执行 。 该 系统 调用 返回 出 错 ， 其 errno 设置 为 EINTR。 这 
样 处 理 是 因为 一 个 信号 发 生 了 ， 进 程 捕捉 到 它 ， 这 意味 着 已 经 发 生 了 某 种 事情 ， 所 以 是 个 好 机 会 
应 当 唤 醒 阻 塞 的 系统 调用 。 


在 这 里 ,我 们 必须 区 分 系统 调用 和 函数 。 当 捕捉 到 某 个 信号 时 , 被 中 断 的 是 内 核 中 执行 的 系统 调用 。 


为 了 支持 这 种 特性 ， 将 系统 调用 分 成 两 类 : 低速 系统 调用 和 其 他 系统 调用 。 低 速 系统 调用 是 
可 能 会 使 进程 永远 阻塞 的 一 类 系统 调用 ， 包 括 : 
e 如 果菜 些 类 型 文件 (如 读 管道 、 终 端 设备 和 网 络 设备 ) 的 数据 不 存在 ， 则 读 操作 可 能 会 
使 调用 者 永远 阻塞 ; 
。 如 果 这 些 数据 不 能 被 相同 的 类 型 文件 立即 接受 ， 则 写 操作 可 能 会 使 调用 者 永远 阻塞 ; 
。 在 某 种 条 件 发 生 之 前 打开 某 些 类 型 文件 ， 可 能 会 发 生 阻塞 〈 例 如 要 打开 一 个 终端 设备 ， 
需要 先 等 待 与 之 连接 的 调制 解 调 器 应 答 ); 
。 pause 函数 (按照 定义 ， 它 使 调用 进程 休眠 直至 捕捉 到 一 个 信号 ) 和 wait 函数 ; 
e. 某 些 ioctl 操作 ; 
e 某 些 进程 间 通 信函 数 〈 见 第 15 章 )。 
在 这 些 低速 系统 调用 中 ， 一 个 值得 注意 的 例外 是 与 磁盘 VO 有 关 的 系统 调用 。 虽 然 读 、 写 一 
个 磁盘 文件 可 能 暂时 阻塞 调用 者 〈 在 磁盘 驱动 程序 将 请 求 排 入 队列 ， 然 后 在 适当 时 间 执 行 请 求 期 
间 )， 但 是 除非 发 生硬 件 错误 ，1/O 操作 总 会 很 快 返 回 ， 并 使 调用 者 不 再 处 于 阻塞 状态 。 
可 以 用 中 断 系 统 调用 这 种 方法 来 处 理 的 一 个 例子 是 :一 个 进程 启动 了 读 终 端 操 作 ， 而 使 用 该 
终端 设备 的 用 户 却 离开 该 终端 很 长 时 间 。 在 这 种 情况 下 ， 进 程 可 能 处 于 阻塞 状态 几 个 小 时 甚至 数 
天 ， 除 非 系统 停机 ， 否 则 一 直 如 此 。 


对 于 中 断 的 read, write 系统 调用 ，POSIX.1 的 语义 在 该 标准 的 2001 版 有 所 改变 。 对 于 如 
何 处 理 已 read, write 部 分 数据 量 的 相应 系统 调用 ， 旱 期 版 本 允许 实现 自行 选择 。 如 若 read 
系统 调用 已 接收 并 传送 数据 至 应 用 程序 缓冲 区 ， 但 尚未 接收 到 应 用 程序 请 求 的 全 部 数据 ， 此 时 被 
中 断 ， 操 作 系 统 可 以 认为 该 系统 调用 失败 ， 并 将 errno 设置 为 EINTR; 另 一 种 处 理 方式 是 允许 
该 系统 调用 成 功 返 回 , 返回 值 是 已 接收 到 的 数据 量 。 与 此 类 似 ， 如 若 write 已 传输 了 应 用 程序 缓 
冲 区 中 的 部 分 数据 , 然后 被 中 断 , 操作 系统 可 以 认为 该 系统 调用 失败 , 并 将 errno KRHA EINTR; 
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另 一 种 处 理 方式 是 允许 该 系统 调用 成 功 返 回 ， 返 回 值 是 已 写 部 分 的 数据 量 。 历 史上 ， 从 System V 
派生 的 实现 将 这 种 系统 调用 视 为 失败 ， 而 BSD 派生 的 实现 则 处 理 为 部 分 成 功 返回 。2001 版 POSIX.1 
标准 采用 BSD 风格 的 语义 。 


与 被 中 断 的 系统 调用 相关 的 问题 是 必须 显 式 地 处 理 出 错 返回 。 典 型 的 代码 序列 (假定 进行 一 
个 读 操作 ， 它 被 中 断 ， 我 们 希望 重新 启动 它 ) WF: 


again: 
if ((n = read(fd, buf, BUFFSIZE)) < 0) { 
if (errno == EINTR) 
goto again; /* just an interrupted system call */ 


/* handle other errors */ 
} 


为 了 帮助 应 用 程序 使 其 不 必 处 理 被 中 断 的 系统 调用 , 4.2BSD 引进 了 某 些 被 中 断 系 统 调 用 的 自 
动 重启 动 。 自 动 重 启动 的 系统 调用 包括 : ioctl. read. readv. write. writev. wait 和 
waitpid。 如 前 所 述 ， 其 中 前 5 个 函数 只 有 对 低速 设备 进行 操作 时 才 会 被 信号 中 断 。 而 wait 和 
waitpid 在 捕捉 到 信和 号 时 总 是 被 中 断 。 因 为 这 种 自动 重启 动 的 处 理 方式 也 会 带 来 问题 ， 某 些 应 用 
程序 并 不 希望 这 些 函数 被 中 断后 重启 动 。 为 此 4.3BSD 人 允许 进程 基于 每 个 信号 禁用 此 功能 。 


POSIX.1 要 求 只 有 中 断 信号 的 SA RESTART 标志 有 效 时 ， 实 现 才 重启 动 系统 调用 。 在 10.14 
节 将 看 到 ，sigaction 函数 使 用 这 个 标志 允许 应 用 程序 请 求 重 启动 被 中 断 的 系统 调用 。 

历史 上 ， 使 用 signal 函数 建立 信号 处 理 程序 时 ， 对 于 如 何 处 理 被 中 断 的 系统 调用 ， 各 种 实 
现 的 做 法 各 不 相同 。System V 的 默认 工作 方式 是 从 不 重启 动 系统 调用 。 而 BSD 则 重启 动 被 信号 中 
断 的 系统 调用 。FreeBSD 8.0, Linux 3.2.0 和 Mac OS X 10.6.8 中 ， 当 信号 处 理 程序 是 用 signal 
函数 时 ， 被 中 断 的 系统 调用 会 重启 动 。 但 Solaris 10 的 默认 方式 是 出 错 返回 ， 将 errno 设置 为 
EINTR。 使 用 用 户 自己 实现 的 signal HH (LA 10-18 ) 可 以 避免 必须 处 理 这 些 差异 的 麻烦 。 


4.2BSD 引入 自动 重启 动 功能 的 一 个 理由 是 : 有 时 用 户 并 不 知道 所 使 用 的 输入 、 输 出 设备 是 否 
是 低速 设备 。 如 果 我 们 编写 的 程序 可 以 用 交互 方式 运行 ， 则 它 可 能 读 、 写 终端 低速 设备 。 如 果 在 
程序 中 捕捉 信号 ， 而 且 系统 并 不 提供 重启 动 功能 ， 则 对 每 次 读 、 写 系统 调用 就 要 进行 是 否 出 错 返 
回 的 测试 ， 如 果 是 被 中 断 的 ， 则 再 调用 读 、 写 系统 调用 。 

图 10-3 列 出 了 儿 种 实现 所 提供 的 与 信号 有 关 的 函数 及 它们 的 语义 。 


信号 处 理 程 | 阻塞 信号 | 被 中 断 系 统 调用 
序 仍 被 安装 的 能 力 的 自动 重启 动 ? 


ISO C. POSIX.1 未 说 明 未 说 明 | ”未 说 明 ”| 
V7. SVR2. SVR3 从 不 
signal 




















ae er GONE ME ZUM 


CR 2BSD 总 是 
4.3BSD、4.4BSD、FreeBSD、Linux、Mac OS X 默认 
POSIX.1、4.4BSD、SVR4、FreeBSD、Linux、 
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图 10-3 ied MERE 
应 当 了 解 ， 其 他 厂商 提供 的 UNIX 系统 可 能 不 同 于 图 10-3 中 所 示 的 情况 。 例 如 ，SunOS 4.1.2 
中 的 sigaction 默认 方式 是 重启 动 被 中 断 的 系统 调用 ， 这 与 列 在 图 10-3 中 的 各 平台 不 同 。 
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在 图 10-18 中 ， 提 供 了 我 们 自己 的 signal 函数 版 本 ， 它 自动 地 尝试 重启 动 被 中 断 的 系统 调 
JH CBR SIGALRM 信号 外 )。 在 图 10-19 中 则 提供 了 另 一 个 函数 signal_intr， 它 不 进行 重启 动 。 
在 14.4 节 说 明 select 和 poll 函数 时 ， 还 将 更 多 涉及 被 中 断 的 系统 调用 。 


10.6 可 重 入 函数 


进程 捕捉 到 信号 并 对 其 进行 处 理 时 ， 进 程 正在 执行 的 正常 指令 序列 就 被 信号 处 理 程序 临时 中 
断 ， 它 首先 执行 该 信号 处 理 程 序 中 的 指令 。 如 果 从 信号 处 理 程序 返回 (例如 没有 调用 exit 或 
longjmp)， 则 继续 执行 在 捕捉 到 信号 时 进程 正在 执行 的 正常 指令 序列 (这 类 似 于 发 生硬 件 中 断 
时 所 做 的 )。 但 在 信号 处 理 程序 中 ， 不 能 判断 捕捉 到 信号 时 进程 执行 到 何 处 。 如 果 进 程 正在 执行 
malloc， 在 其 堆 中 分 配 男 外 的 存储 空间 ， 而 此 时 由 于 捕捉 到 信号 而 插入 执行 该 信号 处 理 程序 ， 
其 中 又 调用 malloc， 这 时 会 发 生 什 么 ”又 例如 ， 若 进程 正在 执行 getpwnam (A 6.2 节 ) 这 种 
将 其 结果 存放 在 静态 存储 单元 中 的 函数 ， 其 间 插 入 执行 信号 处 理 程序 ， 它 又 调用 这 样 的 函数 ， 这 
时 又 会 发 生 什么 呢 ? 在 malloc 例子 中 ， 可 能 会 对 进程 造成 破坏 ， 因 为 malloc 通常 为 它 所 分 配 
的 存储 区 维护 一 个 链表 ， 而 插入 执行 信号 处 理 程序 时 ， 进 程 可 能 正在 更 改 此 链表 。 在 getpwnam 
的 例子 中 ， 返 回 给 正常 调用 者 的 信息 可 能 会 被 返回 给 信号 处 理 程序 的 信息 覆盖 。 

Single UNIX Specification 说 明了 在 信号 处 理 程序 中 保证 调用 安全 的 函数 。 这 些 函数 是 可 重 入 
的 并 被 称 为 是 异步 信号 安全 的 〈async-signal safe)。 除 了 可 重 入 以 外 ， 在 信号 处 理 操作 期 间 ， 它 会 
阻塞 任何 会 引起 不 一 致 的 信号 发 送 。 图 10-4 列 出 了 这 些 异步 信号 安全 的 函数 。 没 有 列 入 图 10-4 中 


abort 
accept 
access 
aio_error 
aio_return 
aio_suspend 
alarm 

bind 
cfgetispeed 
cfgetospeed 
cfsetispeed 
cfsetospeed 
chdir 

chmod 

chown 


clock gettime 
close 
connect 
creat 
dup 
dup2 
execl 
execle 
execv 
execve 
-Exit 


exit 


faccessat 
fchmod 
fchmodat 
fchown 
fchownat 
fcntl 
fdatasync 
fexecve 
fork 

fstat 
fstatat 
fsync 
ftruncate 
futimens 
getegid 
geteuid 
getgid 
getgroups 
getpeername 
getpgrp 
getpid 
getppid 
getsockname 
getsockopt 
getuid 
kill 

link 


linkat 
listen 
lseek 
lstat 
mkdir 
mkdirat 
mkfifo 
mkfifoat 
mknod 
mknodat 
open 
openat 
pause 
pipe 
poll 
posix trace event 
pselect 
raise 
read 
readlink 
readlinkat 
recv 
recvfrom 
recvmsg 
rename 
renameat 
rmdir 


select 

sem post 
send 
sendmsg 
sendto 
setgid 
setpgid 
setsid 
setsockopt 
setuid 
shutdown 
sigaction 
sigaddset 
sigdelset 
sigemptyset 
sigfillset 
sigismember 
signal 
sigpause 
sigpending 
sigprocmask 
sigqueue 
sigset 
sigsuspend 
sleep 
socketmark 
socket 


10-4 ”信号 处 理 程序 可 以 调用 的 可 重 入 函数 


socketpair 
stat 
symlink 
symlinkat 


tcdrain 
tcflow 
tcflush 
tcgetattr 
tcgetpgrp 
tcsendbreak 
tcsetattr 
tcsetpgrp 
time 

timer getoverrun 
timer gettime 
timer settime 
times 

umask 

uname 

unlink 
ulinkat 
utime 
utimensat 
utimes 

wait 

waitpid 





write 
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的 大 多 数 函 数 是 不 可 重 入 的 ， 因 为 (a) 已 知 它们 使 用 静态 数据 结构 ; (C 它们 调用 malloc 或 
free; (c) 它们 是 标准 VO 函数 。 标 准 IO 库 的 很 多 实现 都 以 不 可 重 入 方式 使 用 全 局 数据 结构 。 
注意 ， 虽 然 在 本 书 的 某 些 实例 中 ， 信 和 号 处 理 程序 也 调用 了 printf 函数 ， 但 这 并 不 保证 产生 所 期 
望 的 结果 ， 信 和 号 处 理 程 序 可 能 中 断 主 程序 中 的 printf 函数 调用 。 

应 当 了 解 , 即使 信号 处 理 程序 调用 的 是 图 10-4 中 的 函数 , 但 是 由 于 每 个 线程 只 有 一 个 errno 
变量 (回忆 1.7 节 对 errno 和 线程 的 讨论 )， 所 以 信号 处 理 程 序 可 能 会 修改 其 原先 值 。 考 虑 一 个 
信和 号 处 理 程序 ， 它 恰好 在 main WIKRE errno 之 后 被 调用 。 如 果 该 信号 处 理 程序 调用 read 这 类 
函数 , 则 它 可 能 更 改 errno 的 值 ， 从 而 取代 了 刚 由 main 设置 的 值 。 因 此 , 作为 一 个 通用 的 规则 ， 
当 在 信号 处 理 程序 中 调用 图 10-4 中 的 函数 时 , 应当 在 调用 前 保存 errno, 在 调用 后 恢复 errno. 
(应 当 了 解 ， 经 常 被 捕捉 到 的 信号 是 SIGCHLD， 其 信号 处 理 程 序 通常 要 调用 一 种 wait 函数 ， 而 
各 种 wait 函数 都 能 改变 errno。) 

注意 ， 图 10-4 没有 包括 longjmp (7.10 节 ) 和 siglongjmp (10.15 节 )。 这 是 因为 主 例 程 
以 非 可 重 入 方式 正在 更 新 一 个 数据 结构 时 可 能 产生 信号 。 如 果 不 是 从 信号 处 理 程序 返回 而 是 调用 
siglongjmp， 那 么 该 数据 结构 可 能 是 部 分 更 新 的 。 如 果 应 用 程序 将 要 做 更 新 全 局 数据 结构 这 样 
的 事情 ， 而 同时 要 捕捉 某 些 信号 ， 而 这 些 信号 的 处 理 程序 又 会 引起 执行 siglongjmp， 则 在 更 新 
这 种 数据 结构 时 要 阻塞 此 类 信和 号 。 


s S 


图 10-5 给 出 了 一 段 程序 ， 这 段 程 序 从 信号 处 理 程序 my alarm 调用 非 可 重 入 函数 getpwnam, 
而 my alarm 每 秒 钟 被 调用 一 次 。10.10 节 中 将 说 明 alarm 函数 。 在 该 程序 中 调用 alarm 函数 
使 得 每 秒 产生 一 次 SIGALRM 信和 号 。 


#include "apue.h" 
#include <pwd.h> 


static void 
my_alarm(int signo) 
{ 


struct passwd *rootptr; 


printf("in signal handler\n"); 

if ((rootptr = getpwnam("root")) -- NULL) 
err sys("getpwnam(root) error"); 

alarm(1); 


int 
main(void) 
{ 
struct passwd *ptr; 


signal (SIGALRM, my alarm); 
alarm(1); 
ESE (o£ 
if ((ptr = getpwnam("sar")) -- NULL) 
err sys("getpwnam error"); 
if (strcmp(ptr-»pw name, "sar") != 0) 


329 
? 


330 


331 
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printf("return value corrupted!, pw name = $s\n", 
ptr-»pw name); 


图 10-5 在 信号 处 理 程 序 中 调用 不 可 再 入 函数 

运行 该 程序 时 ， 其 结果 具有 随机 性 。 通 常 ， 在 信号 处 理 程序 经 多 次 迭代 返回 时 ， 该 程序 
将 由 SIGSEGV 信和 号 终止 。 检 查 core 文件 ， 从 中 可 以 看 到 main 函数 已 调用 getpwnam, fH 
当 getpwnam 调用 free 时 ， 信 和 号 处 理 程序 中 断 了 它 的 运行 ， 并 调用 getpwnam， 进 而 再 次 调 
用 free。 在 信号 处 理 程序 调用 free 而 主 程序 也 在 调用 free 时 ，malloc 和 free 维护 的 数 
据 结构 就 出 现 了 损坏 ， 偶 然 ， 此 程序 会 运行 若干 秒 ， 然 后 因 产 生 SIGSEGV 信号 而 终止 。 在 捕捉 
到 信号 后 ， 若 main 函数 仍 正确 运行 ， 其 返回 值 却 有 时 错误 ， 有 时 正确 。 

从 此 实例 中 可 以 看 出 ， 如 果 在 信号 处 理 程序 中 调用 一 个 非 可 重 入 函数 ， 则 其 结果 是 不 可 预 
知 的 。 w 


10.7 SIGCLD 语义 


SIGCLD 和 SIGCHLD 这 两 个 信号 很 容易 被 混淆 。SIGCLD (没有 日 ) 是 System V 的 一 个 信号 
名 ， 其 语义 与 名 为 SIGCHLD 的 BSD 信号 不 同 。POSIX.1 采用 BSD 的 SIGCHLD 信和 号 。 

BSD 的 SIGCHLD 信号 语义 与 其 他 信和 号 的 语义 相 类 似 。 子 进程 状态 改变 后 产生 此 信号 ， 父 进 
程 需要 调用 一 个 wait 函数 以 检测 发 生 了 什么 。 

System V 处 理 SIGCLD 信和 号 的 方式 不 同 于 其 他 信和 号。 如果 用 signal 或 sigset (早期 设置 
信号 配置 的 ， 与 SRV3 兼容 的 函数 ) 设置 信号 配置 ， 则 基于 SVR4 的 系统 继承 了 这 一 具有 问题 色 
彩 的 传统 〈 即 兼容 性 限制 )。 对 于 SIGCLD 的 早期 处 理 方式 是 : 

C1) 如 果 进 程 明确 地 将 该 信号 的 配置 设置 为 SIG_IGN， 则 调用 进程 的 子 进程 将 不 产生 僵 死 进 
程 。 注 意 ， 这 与 其 默认 动作 (SIG_DFL)“ 忽 略 ”( 见 图 10-1) 不 同 。 子 进程 在 终止 时 ， 将 其 状态 
丢弃 。 如 果 调 用 进程 随后 调用 一 个 wait 函数 ， 那 么 它 将 阻塞 直到 所 有 子 进 程 都 终止 ， 然 后 该 wait 
会 返回 -1， 并 将 其 errno 设置 为 ECHILD。( 此 信号 的 默认 配置 是 忽略 ， 但 这 不 会 使 上 述 语义 起 
作用 。 必 须 将 其 配置 明确 指定 为 SIG IGN 才 可 以 。) 


POSIX.1 并 未 说 明 在 SIGCHLD 被 忽略 时 应 产生 的 后 果 ， 所 以 这 种 行为 是 允许 的 。Single UNIX 
Specification 的 XSI 扩展 选项 要 求 对 于 SIGCHLD 支持 这 种 行为 。 
如 果 SIGCHLD 被 忽略 ，4.4BSD 总 是 产生 僵 死 进程 。 如 果 要 避免 僵 死 进程 ， 则 必须 等 待 子 进 
程 。 在 SVR4 中 ， 如 果 调 用 signal 或 sigset 将 SIGCHLD 的 配置 设置 为 忽略 ， 则 决 不 会 产生 
僵 死 进程 。 本 书 讨论 的 4 种 平台 在 此 方面 都 追随 SVR4 的 行为 。 
使 用 sigaction 可 设置 SA_NOCLDWAIT 标志 ( 见 图 10-6 ) 以 避免 进程 僵 死 。 本 书 讨论 的 4 
种 平台 都 支持 这 一 点 。 
(2) 如 果 将 SIGCLD 的 配置 设置 为 捕 提 ， 则 内 核 立 即 检 查 是 否 有 子 进程 准备 好 被 等 待 ， 如 果 


是 这 样 ， 则 调用 SIGCLD 处 理 程 序 。 
第 2 种 方式 改变 了 为 此 信和 号 编写 处 理 程序 的 方法 ， 这 一 点 可 在 下 面 的 实例 中 看 到 。 
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下 实例 


10.4 节 曾 提 到 ， 进 入 信号 处 理 程序 后 ， 首 先 要 调用 signal 函数 以 重新 设置 此 信号 处 理 程序 
(在 信号 被 重 置 为 其 默认 值 时 ， 它 可 能 会 丢失 ,立即 重新 设置 可 以 减少 此 窗口 时 间 )。 图 10-6 展示 
了 这 一 点 。 但 此 程序 不 能 在 某 些 传统 的 System V 平台 上 正常 工作 。 程 序 一 行 行 地 不 断 重复 输出 
“SIGCLD received”， 最 后 进程 用 完 其 栈 空间 并 异常 终止 。 


#include "apue.h" 
#include <sys/wait.h> 





static void sig_cld(int); 


int 
main () 
{ 
pid_t pid; 


if (signal(SIGCLD, sig_cld) == SIG_ERR) 
perror("signal error"); 

if ((pid = fork()) < 0) { 
perror("fork error"); 

) else if (pid == 0) { /* child */ 
sleep(2); 
.exit(0); 


pause(); /* parent */ 
exit (0); 
) 


static void 


sig cld(int signo) /* interrupts pause() */ 
{ 

pid_t pid; 

int status; 


printf ("SIGCLD received\n"); 


if (signal(SIGCLD, sig_cld) == SIG_ERR) /* reestablish handler */ 
perror("signal error"); 


if ((pid = wait (&status)) < 0) /* fetch child status */ 
perror ("wait error"); 


printf("pid = $dWMn", pid); 


图 10-6 不 能 正常 工作 的 System V SIGCLD 处 理 程序 


因为 基于 BSD 的 系统 通常 并 不 支持 早期 System V 的 SIGCLD 语义 ,所 以 FreeBSD 8.0 和 Mac 
OS X 10.6.8 并 没有 出 现 此 问题 。Linux 3.2.0 也 没有 出 现 此 问题 ， 其 原因 是 ， 虽然 SIGCLD 和 
SIGCHLD 定义 为 相同 的 值 ， 但 当 一 个 进程 安排 捕 提 SIGCHLD， 并 且 已 经 有 进程 准备 好 由 其 父 进 
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程 等 待 时 ， 该 系统 并 不 调用 SIGCHLD 信号 的 处 理 程序 。Solaris 10 在 此 种 情况 时 确实 调用 该 信号 
处 理 程序 ， 但 在 内 核 中 增加 了 避免 此 问题 的 代码 。 

虽然 本 书 说 明 的 所 有 4 种 平台 都 解决 了 这 一 问题 ， 但 是 应 当 意识 到 没有 解决 这 一 问题 的 平台 
(如 AIX ) 依然 存在 。 


此 程序 的 问题 是 : 在 信号 处 理 程序 的 开始 处 调用 signal, ER LRE 2 种 方式 ， 内 核 
检查 是 否 有 需要 等 待 的 子 进 程 〈 因 为 我 们 正在 处 理 一 个 SIGCLD 信号 , 所 以 确实 有 这 种 子 进 
程 )， 所 以 它 产生 另 一 个 对 信号 处 理 程序 的 调用 。 信 号 处 理 程序 调用 signal， 整 个 过 程 再 
次 重复 。 

为 了 解决 这 一 问题 ， 应 当 在 调用 wait 取 到 子 进程 的 终止 状态 后 再 调用 signal。 此 时 仅 当 
其 他 子 进程 终止 ， 内 核 才 会 再 次 产生 此 种 信号。 

如 果 为 SIGCHLD 建立 了 一 个 信号 处 理 程序 ， 又 存在 一 个 已 终止 但 父 进程 尚未 等 待 它 的 进程 ， 
则 是 否 会 产生 信号 ? POSIX. 对 此 没有 做 说 明 。 这 就 允许 前 面 所 述 的 工作 方式 。 但 是 ，POSIX.1 
在 信号 发 生 时 并 没有 将 信号 处 理 重 置 为 其 默认 值 (假定 正 调用 POSIX.1 的 sigaction 函数 设置 
其 配置 )， 于 是 在 SIGCHLD 处 理 程序 中 也 就 不 必 再 为 该 信号 指定 一 个 信号 处 理 程序 。 a 


务必 了 解 你 所 用 的 系统 实现 中 SIGCHLD 信号 的 语义 。 也 应 了 解 在 某 些 系 统 中 #define 
SIGCHLD 为 SIGCLD 或 反之 。 更 改 这 种 信号 的 名 字 使 你 可 以 编译 为 另 一 个 系统 编写 的 程序 ， 但 是 
如 果 这 一 程序 使 用 该 信号 的 另 一 种 语义 ， 程 序 有 可 能 不 会 正常 工作 。 
在 本 书 说 明 的 4 种 平台 上 ， 只 有 Linux 3.2.0 和 Solaris 10 定义 了 SIGCLD, SIGCLD 等 同 于 
SIGCHLD。 


10.8 可靠 信 号 术语 和 语义 


我 们 需要 先 定义 一 些 在 讨论 信号 时 会 用 到 的 术语 。 首 先 ， 当 造成 信号 的 事件 发 生 时 ， 为 进程 
产生 一 个 信号 (或 向 一 个 进程 发 送 一 个 信号 )。 事 件 可 以 是 硬件 异常 (如 除 以 0)、 软 件 条 件 〈 如 
alarm 定时 器 超时 )、 终 端 产 生 的 信号 或 调用 kill 函数 。 当 一 个 信号 产生 时 ， 内 核 通常 在 进程 
表 中 以 某 种 形式 设置 一 个 标志 。 

当 对 信和 号 采取 了 这 种 动作 时 ， 我 们 说 向 进程 递送 了 一 个 信号 。 在 信和 号 产生 (generation) Alix 
i (delivery) 之 间 的 时 间 间 隔 内 ， 称 信号 是 未 决 的 《pending)。 

进程 可 以 选用 “阻塞 信号 递送 ”。 如 果 为 进程 产生 了 一 个 阻塞 的 信和 号， 而 且 对 该 信号 的 动作 
是 系统 默认 动作 或 捕捉 该 信号 ， 则 为 该 进程 将 此 信号 保持 为 未 决 状态 ， 直 到 该 进程 对 此 信和 号 解除 
了 阻塞 ,或 者 将 对 此 信号 的 动作 更 改 为 忽略 。 内 核 在 递送 一 个 原来 被 阻塞 的 信号 给 进程 时 (而 不 
是 在 产生 该 信号 时 )， 才 决定 对 它 的 处 理 方式 。 于 是 进程 在 信号 递送 给 它 之 前 仍 可 改变 对 该 信和 号 
的 动作 。 进 程 调用 sigpending 函数 CH 10.13 节 ) 来 判定 哪些 信号 是 设置 为 阻塞 并 处 于 未 决 状 
态 的 。 

如 果 在 进程 解除 对 某 个 信号 的 阻塞 之 前 ， 这 种 信号 发 生 了 多 次 ， 那 么 将 如 何 呢 ? POSIX.1 ft 
许 系 统 递 送 该 信号 一 次 或 多 次 。 如 果 递 送 该 信号 多 次 ， 则 称 这 些 信号 进行 了 排队 。 但 是 除非 支持 
POSIX.1 实时 扩展 ， 和 否则 大 多 数 UNIX 并 不 对 信号 排队 ， 而 是 只 递送 这 种 信号 一 次 。 
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SUSv4 中 ， 实 时 信号 功能 已 经 移 至 基础 规范 的 实时 扩展 部 分 。 随 着 时 间 的 推移 ， 更 多 的 系统 
即使 不 支持 实时 扩展 ， 也 会 支持 信号 排队 。 我 们 将 在 10.20 节 中 进一步 讨论 排队 信号 。 

SVR2 的 手册 页 称 ， 在 进程 执行 SIGCLD 信号 处 理 程序 期 间 ， 该 信号 是 用 排队 方式 处 理 的 ， 
虽然 在 概念 层次 这 可 能 是 真 的 ， 但 实际 并 非 如 此 。 内 核 是 按照 10.7 节 中 所 述 方式 产生 此 信号 。SVR3 
的 手册 页 对 此 做 了 修改 , 它 指明 在 进程 执行 SIGCLD 信号 处 理 程序 期 间 ， 忽略 SIGCLD 信号 。SVR4 
手册 页 删除 了 有 关 部 分 。 

AT&T[1990e] 中 的 SVR4 sigaction(2) 手 册页 称 SA SIGINFO 标志 ( UA 10-16) 使 信号 可 
靠 地 排队 ， 这 是 不 正确 的 。 表 面 上 内 核 部 分 地 实现 了 此 功能 ， 但 在 SVR4 中 并 不 起 作用 。 令 人 不 
可 思议 的 是 ，SVID (System V 接口 定义 ) 对 这 种 可 靠 队列 并 未 做 同样 的 声明 。 


如 果 有 多 个 信号 要 递送 给 一 个 进程 ， 那 将 如 何 呢 ? POSIX.1 并 没有 规定 这 些 信 和 号 的 递送 顺序 。 但 
是 POSIX.1 基础 部 分 建议 : 在 其 他 信号 之 前 递送 与 进程 当前 状态 有 关 的 信号 ， 如 SIGSEGV. 

每 个 进程 都 有 一 个 信号 屏蔽 字 (signal mask)， 它 规定 了 当前 要 阻塞 递送 到 该 进程 的 信号 集 。 对 
于 每 种 可 能 的 信号 ， 该 屏蔽 字 中 都 有 一 位 与 之 对 应 。 对 于 某 种 信号 ， 若 其 对 应 位 已 设置 ， 则 它 当 前 是 
被 阻塞 的 。 进 程 可 以 调用 sigprocmask (在 10.12 节 中 说 明 ) 来 检测 和 更 改 其 当前 信和 号 屏蔽 字 。 

信号 编号 可 能 会 超过 一 个 整 型 所 包含 的 二 进 制 位 数 ， 因 此 POSIX.1 定义 了 一 个 新 数据 类 型 
sigset t， 它 可 以 容纳 一 个 信号 集 。 例 如 ， 信 和 号 屏蔽 字 就 存放 在 其 中 一 个 信号 集中 。10.11 节 将 
说 明 对 信和 号 集 进 行 操作 的 5 个 函数 。 


10.9 AŽ kill 和 raise 


kill 函数 将 信和 与 发 送 给 进程 或 进程 组 。raise 函数 则 允许 进程 向 自身 发 送信 号 。 
raise 最 初 是 由 ISOC 定义 的 。 后 来 ， 为 了 与 ISO C 标准 保持 一 致 ，POSIX.1 也 包括 了 该 函 
数 。 但 是 POSIX.1 扩展 了 raise 的 规范 ， 使 其 可 处 理 线程 (12.8 中 讨论 线程 如 何 与 信号 交互 )。 
因为 ISO C 并 不 涉及 多 进程 ， 所 以 它 不 能 定义 以 进程 ID 作为 其 参数 (如 kill BH) 的 函数 。 [336] 


#include <signal.h> 


int kill(pid_t pid, int signo); 


int raise(int signo); 





两 个 函数 返回 值 : 若 成 功 ， 返 回 0;， 若 出 错 ， 返 回 -1 





调用 
raise(signo); 
等 价 于 调用 
kill(getpid(), signo); 
kill 的 pid 参数 有 以 下 4 种 不 同 的 情况 。 
pid>0 将 该 信号 发 送 给 进程 ID 为 pid 的 进程 。 
pid 一 0 将 该 信号 发 送 给 与 发 送 进程 属于 同一 进程 组 的 所 有 进程 〈 这 些 进 程 的 进程 组 ID 
等 于 发 送 进程 的 进程 组 ID)， 而 且 发 送 进程 具有 权限 向 这 些 进程 发 送信 号 。 这 
里 用 的 术语 “所 有 进程 ”不 包括 实现 定义 的 系统 进程 集 。 对 于 大 多 数 UNIX 系 
统 ， 系 统 进程 集 包 括 内 核 进程 和 init (pid JJ 1). 
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pid<0 将 该 信号 发 送 给 其 进程 组 ID 等 于 pid 绝对 值 , 而 且 发 送 进程 具有 权限 向 其 发 送 

信号 的 所 有 进程 。 如 前 所 述 ， 所 有 进程 并 不 包括 系统 进程 集中 的 进程 。 

pid — -1 将 该 信号 发 送 给 发 送 进程 有 权限 向 它们 发 送信 号 的 所 有 进程 。 如 前 所 述 ， 所 有 

进程 不 包括 系统 进程 集中 的 进程 。 

如 前 所 述 ， 进 程 将 信号 发 送 给 其 他 进程 需要 权限 。 超 级 用 户 可 将 信号 发 送 给 任 一 进程 。 对 于 
非 超 级 用 户 ， 其 基本 规则 是 发 送 者 的 实际 用 户 ID 或 有 效用 户 ID 必须 等 于 接收 者 的 实际 用 户 ID 
或 有 效用 户 ID。 如 果实 现 支持 _PoSIX_SAVED_IDS (如 POSIX.1 现在 要 求 的 那样 )， 则 检查 接收 
者 的 保存 设置 用 户 ID (而 不 是 有 效用 户 ID )。 在 对 权限 进行 测试 时 也 有 一 个 特例 ， 如果 被 发 送 的 
信号 是 SIGCONT， 则 进程 可 将 它 发 送 给 属于 同一 会 话 的 任 一 其 他 进程 。 

POSIX. 将 信号 编号 0 定义 为 空 信和 号。 如 果 signo 参数 是 0, W kill 仍 执行 正常 的 错误 检查 ， 
但 不 发 送信 号 。 这 常 被 用 来 确定 一 个 特定 进程 是 否 仍 然 存 在 。 如 果 向 一 个 并 不 存在 的 进程 发 送 空 
a, W kill 返回 -1，errno 被 设置 为 ESRCH。 但 是 ， 应 当 注意 ，UNIX 系统 在 经 过 一 定时 间 
后 会 重新 使 用 进程 ID, 所 以 一 个 现 有 的 具有 所 给 定 进程 ID 的 进程 并 不 一 定 就 是 你 所 想 要 的 进程 。 

还 应 理解 的 是 , 测试 进程 是 否 存在 的 操作 不 是 原子 操作 。 在 kill 向 调用 者 返回 测试 结果 时 ， 
原来 已 存在 的 被 测试 进程 此 时 可 能 已 经 终止 ， 所 以 这 种 测试 并 无 多 大 价值 。 

如 果 调 用 kill 为 调用 进程 产生 信号 ， 而 且 此 信和 号 是 不 被 阻塞 的 ， 那 么 在 kill 返回 之 前 ， 
signo 或 者 某 个 其 他 未 决 的 、 非 阻塞 信号 被 传送 至 该 进程 。( 对 于 线程 而 言 ， 还 有 一 些 附 加 条 件 ; 
详细 情况 见 12.8 节 。) 


10.10 PAR alarm 和 Pause 





使 用 alarm 函数 可 以 设置 一 个 定时 器 〈 闹 钟 时 间 )， 在 将 来 的 某 个 时 刻 该 定时 器 会 超时 。 当 
定时 器 超时 时 ， 产 生 SIGALRM 信号 。 如 果 忽 略 或 不 捕捉 此 信号 ， 则 其 默认 动作 是 终止 调用 该 
alarm 函数 的 进程 。 


#include <unistd.h> 


unsigned int alarm(unsigned int seconds) ; 





返回 值 : 0 eX EA mU UE EE P e T Ti] I AS RY 
参数 seconds 的 值 是 产生 信号 SIGALRM 需要 经 过 的 时 钟 秒 数 。 当 这 一 时 刻 到 达 时 , 信号 由 内 
核 产 生 ， 由 于 进程 调度 的 延迟 ， 所 以 进程 得 到 控制 从 而 能 够 处 理 该 信号 还 需要 一 个 时 间 间 隔 。 
早期 的 UNIX 系统 实现 曾 提出 警告 ,这 种 信号 可 能 比 预 定 值 提前 1s 发送 。POSIX.1 则 不 允许 
这 样 做 。 
每 个 进程 只 能 有 一 个 闸 钟 时 间 。 如 果 在 调用 alarm 时 ， 之 前 已 为 该 进程 注册 的 闹钟 时 间 还 没有 超 
时 ， 则 该 疗 钟 时 间 的 余 留 值 作为 本 次 alarm 函数 调用 的 值 返回 。 以 前 注册 的 闹钟 时 间 则 被 新 值 代 奉 。 
如 果 有 以 前 注册 的 尚未 超过 的 益 钟 时 间 , 而 且 本 次 调用 的 seconds 值 是 0, 则 取消 以 前 的 闹钟 
时 间 ， 其 余 留 值 仍 作为 alarm 函数 的 返回 值 。 
虽然 SIGALRM 的 默认 动作 是 终止 进程 ， 但 是 大 多 数 使 用 闹钟 的 进程 捕捉 此 信和 号。 如果 此 时 
进程 要 终止 ， 则 在 终止 之 前 它 可 以 执行 所 需 的 清理 操作 。 如 果 我 们 想 捕捉 SIGALRM 信号 ， 则 必 
须 在 调用 alarm 之 前 安装 该 信号 的 处 理 程序 。 如 果 我 们 先 调用 alarm， 然 后 在 我 们 能 够 安装 
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SIGALRM 处 理 程序 之 前 已 接 到 该 信号 ， 那 么 进程 将 终止 。 
pause 函数 使 调用 进程 挂 起 直至 捕捉 到 一 个 信号 。 


#include <unistd.h> 






int pause (void); 
: —l, errno 设置 为 EINTR 


只 有 执行 了 一 个 信号 处 理 程序 并 从 其 返回 时 ，pause 才 返 回 。 在 这 种 情况 下 ，pause 返回 -1， 
errno 设置 为 EINTR。 


四 实例 


使 用 alarm 和 Pause， 进 程 可 使 自己 休眠 一 段 指定 的 时 间 。 图 10-7 中 的 sleep] 函数 看 似 
提供 了 这 种 功能 〈 其 实 这 里 面 存在 问题 ， 我 们 很 快 就 会 看 到 )。 


#include <signal.h> 
#include <unistd.h> 


static void 
sig_alrm(int signo) 
{ 
/* nothing to do, just return to wake up the pause */ 
} 


unsigned int 
sleepl (unsigned int seconds) 


{ 


if (signal(SIGALRM, sig_alrm) == SIG_ERR) 
return (seconds) ; 
alarm(seconds) ; /* start the timer */ 
pause (); /* next caught signal wakes us up */ 
return(alarm(0)); /* turn off timer, return unslept time */ 


图 10-7 sleep 简化 而 不 完整 的 实现 

程序 中 的 sleepl 函数 看 起 来 与 将 在 10.19 节 中 说 明 的 sleep 函数 类 似 , 但 这 种 简单 实现 有 
以 下 3 个 问题 。 

CD 如 果 在 调用 sleep1 之 前 ， 调 用 者 已 设置 了 闹钟 ， 则 它 被 sleep] 函数 中 的 第 一 次 alarm 
调用 擦 除 。 可 用 下 列 方法 更 正 这 一 点 : 检查 第 一 次 调用 alarm 的 返回 值 ， 如 其 值 小 于 本 次 调用 
alarm 的 参数 值 ， 则 只 应 等 到 已 有 的 闹钟 超时 。 如 果 之 前 设置 的 闹钟 超时 时 间 晚 于 本 次 设置 值 ， 
WHE sleepl 函数 返回 之 前 ， 重 置 此 闹钟 ， 使 其 在 之 前 六 钟 的 设 定时 间 再 次 发 生 超时 。 

(2) 该 程序 中 修改 了 对 SIGALRM 的 配置 。 如 果 编 写 了 一 个 函数 供 其 他 函数 调用 ， 则 在 该 函 
数 被 调用 时 先 要 保存 原配 置 , 在 该 函数 返回 前 再 恢复 原配 置 。 更 正 这 一 点 的 方法 是 : 保存 signal 
函数 的 返回 值 ， 在 返回 前 重 置 原配 置 。 

(3) 在 第 一 次 调用 alarm 和 pause 之 间 有 一 个 竞争 条 件 。 在 一 个 繁忙 的 系统 中 ， 可 能 alarm 
在 调用 pause 之 前 超时 ， 并 调用 了 信号 处 理 程序 。 如 果 发 生 了 这 种 情况 ， 则 在 调用 pause Ja, 
如 果 没 有 捕捉 到 其 他 信号 ， 调 用 者 将 永远 被 挂 起 。 339 

sleep 的 早期 实现 与 图 10-7 程序 类 似 ， 但 更 正 了 第 1 个 和 第 2 个 问题 。 有 两 种 方法 可 以 更 正 第 
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3 个 问题 。 第 一 种 方法 是 使 用 setjmp, 下 一 个 实例 将 说 明 这 种 方法 。 另 一 种 方法 是 使 用 sigprocmask 
和 sigsuspend，10.19 节 将 说 明 这 种 方法 。 n 


下 实例 
SVR2 中 的 sleep 实现 使 用 了 setjmp 和 longjmp ( 见 7.10 节 )， 以 避免 前 一 个 实例 的 第 3 
个 问题 中 说 明 的 竞争 条 件 。 此 函数 的 一 个 简化 版 本 称 为 sleep2， 示 于 图 10-8 中 (为 了 缩短 实例 
程序 的 长 度 ， 程 序 中 没有 处 理 上 面 所 说 的 第 1 个 和 第 2 个 问题 )。 


#include <setjmp.h> 
#include <signal.h> 
#include <unistd.h> 
static jmp_buf env_alrm; 


static void 
sig_alrm(int signo) 
{ 
longjmp(env_alrm, 1); 
} 


unsigned int 
sleep2 (unsigned int seconds) 


{ 


if (signal (SIGALRM, sig_alrm) == SIG ERR) 
return (seconds) ; 
if (setjmp(env_alrm) == 0) { 
alarm(seconds) ; /* start the timer */ 
pause(); /* next caught signal wakes us up */ 
} 
return(alarm(0)); /* turn off timer, return unslept time */ 


图 10-8 sleep 的 男 一 个 不 完善 的 实现 

在 此 函数 中 ， 已 避免 了 图 10-7 中 具有 的 竞争 条 件 。 即 使 pause 从 未 执行 ， 在 发 生 SIGALRM 
时 ，sleep2 函数 也 返回 。 

但 是 ，sleep2 函数 中 却 有 另 一 个 难以 察觉 的 问题 ， 它 涉及 与 其 他 信和 号 的 交互 。 如 果 SIGALRM 
中 断 了 某 个 其 他 信和 号 处 理 程序 ， 则 调用 longjmp 会 提早 终止 该 信号 处 理 程序 。 图 10-9 显示 了 这 
种 情况 。SIGINT 处 理 程 序 中 包含 了 for 循环 语句 ， 它 在 作者 所 用 系统 上 的 执行 时 间 超 过 Ss, th 
就 是 大 于 sleep2 的 参数 值 ， 这 正 是 我 们 想 要 的 。 整 型 变量 k 说 明 为 volatile， 这 样 就 阻 上 了 

优化 编译 程序 去 除 循 环 语句。 


#include "apue.h" 


unsigned int sleep2 (unsigned int); 
static void sig_int (int); 
int 


main (void) 
{ 


unsigned int unslept; 
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if (signal(SIGINT, sig int) == SIG ERR) 
err sys("signal(SIGINT) error"); 
unslept - sleep2(5); 
printf("sleep2 returned: %u\n", unslept); 
exit (0); 
} 


static void 
sig_int(int signo) 
{ 


int Ly j* 
volatile int k; 
/* 


* Tune these loops to run for more than 5 seconds 

* on whatever system this test program is run. 

A 
printf("\nsig_int starting\n"); 
for (i = 0; i < 300000; i++) 

for (j = 0; j < 4000; j++) 
kote be y 

printf("sig int finished\n") ; 





10-9 在 一 个 捕捉 其 他 信和 号 的 程序 中 调用 sleep2 
执行 图 10-9 中 的 程序 ， 可 以 通过 键入 中 断 字符 来 中 断 休 了 眠 ， 运 行 结果 如 下 : 
$ ./a.out 
^c 键入 中 断 字 符 
sig_int starting 
sleep2 returned: 0 


从 中 可 见 sleep2 函数 所 引起 的 1ongjmp 使 男 一 个 信号 处 理 程序 sig int 提早 终止 ， 即 使 它 未 
完成 也 会 如 此 。 如 果 将 SVR2 的 sleep 函数 与 其 他 信号 处 理 程序 一 起 使 用 ， 就 可 能 碰 到 这 种 情况 。 


见习 题 10.3。 Á 
sleepl 和 sleep2 函数 的 这 两 个 实例 是 告诉 我 们 在 涉及 信号 时 需要 有 精细 而 周到 的 考虑 。 下 面 

几 节 将 说 明 解决 这 些 问题 的 方法 ， 使 我 们 能 够 可 靠 地 、 在 不 影响 其 他 代码 段 的 情况 下 处 理 信和 号。 341 

得 实例 


除了 用 来 实现 sleep 函数 外 ，alarm 还 常用 于 对 可 能 阻塞 的 操作 设置 时 间 上 限 值 。 例 如 ， 
程序 中 有 一 个 读 低速 设备 的 可 能 阻塞 的 操作 《〈 见 10.5 节 )， 我 们 希望 超过 一 定时 间 量 后 就 停止 执 
行 该 操作 。 图 10-10 实现 了 这 一 点 ， 它 从 标准 输入 读 一 行 ， 然 后 将 其 写 到 标准 输出 上 。 


#include "apue.h" 





static void sig_alrm(int); 


int 
main (void) 
{ 


int n; 
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char line [MAXLINE]; 


if (signal(SIGALRM, sig_alrm) == SIG_ERR) 
err_sys ("signal (SIGALRM) error"); 


alarm(10); 

if ((n = read(STDIN FILENO, line, MAXLINE)) < 0) 
err sys("read error"); 

alarm(0); 


write(STDOUT FILENO, line, n); 
exit(0); 
} 


static void 
sig_alrm(int signo) 
{ 
/* nothing to do, just return to interrupt the read */ 


} 
图 10-10 ” 带 时 间 限 制 调用 read 

这 种 代码 序列 在 很 多 UNIX 应 用 程序 中 都 能 见 到 ， 但 是 这 种 程序 有 两 个 问题 : 

(1) 图 10-10 中 的 程序 具有 与 图 10-7 中 的 程序 相同 的 问题 : 在 第 一 次 alarm 调用 和 read 
调用 之 间 有 一 个 竞争 条 件 。 如 果 内 核 在 这 两 个 函数 调用 之 间 使 进程 阻塞 ， 不 能 占用 处 理 机 运行 ， 
而 其 时 间 长 度 又 超过 闹钟 时 间 ， 则 read 可 能 永远 阻塞 。 大 多 数 这 种 类 型 的 操作 使 用 较 长 的 闹钟 
时 间 ， 例 如 1 分 钟 或 更 长 一 点 ， 使 这 种 问题 不 会 发 生 ， 但 无 论 如 何 这 是 一 个 竞争 条 件 。 

(2) 如 果 系 统 调用 是 自动 重启 动 的 ， 则 当 从 SIGALRM 信号 处 理 程 序 返 回 时 ，read 并 不 被 中 

断 。 在 这 种 情形 下 ， 设 置 时 间 限 制 不 起 作用 。 


在 这 里 我 们 确实 需要 中 断 慢 速 系统 调用 。 我 们 将 在 10.14 节 对 此 进行 详细 讨论 。 d 
四 实例 


让 我 们 用 longjmp 再 实现 前 面 的 实例 。 使 用 这 种 方法 无 需 担 心 一 个 慢 速 的 系统 调用 是 否 被 
中 断 ， 见 图 10-11。 


#include "apue.h" 
#include <setjmp.h> 


static void sig_alrm(int); 
static jmp_buf env_alrm; 
int 


main (void) 


{ 


int n; 

char line[MAXLINE]; 

if (signal(SIGALRM, sig alrm) -- SIG ERR) 
err sys("signal(SIGALRM) error"); 

if (setjmp(env alrm) != 0) 


err quit("read timeout"); 
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alarm(10); 

if ((n = read(STDIN FILENO, line, MAXLINE)) < 0) 
err sys("read error"); 

alarm(0); 


write(STDOUT FILENO, line, n); 
exit(0); 
} 


static void 
sig_alrm(int signo) 
{ 
longjmp(env_alrm, 1); 


} 
图 10-11 使 用 Iongjmp， 带 时 间 限 制 调用 read 
不 管 系统 是 否 重 新 启动 被 中 断 的 系统 调用 ， 该 程序 都 会 如 所 预期 的 那样 工作 。 但 是 要 知道 ， 
该 程序 仍旧 有 和 图 10-8 中 的 程序 相同 的 与 其 他 信和 号 处 理 程序 交互 的 问题 。 m 
如 果 要 对 VO 操作 设置 时 间 限 制 , 则 如 上 所 示 可 以 使 用 1ongjmp， 当 然 也 要 清楚 它 可 能 有 与 
其 他 信和 号 处 理 程序 交互 的 问题 。 另 一 种 选择 是 使 用 select 或 poll 函数 ，14.4.1 WA 14.4.2 节 
将 对 它们 进行 说 明 。 


10.11 fast 


我 们 需要 有 一 个 能 表示 多 个 信和 号 $3 k (signal set) 的 数据 类 型 。 我 们 将 在 sigprocmask 
(下 一 节 中 说 明 ) 类 函数 中 使 用 这 种 数据 类 型 ， 以 便 告诉 内 核 不 允许 发 生 该 信号 集中 的 信号 。 如 
前 所 述 ， 不 同 的 信号 的 编号 可 能 超过 一 个 整 型 量 所 包含 的 位 数 ， 所 以 一 般 而 言 ， 不 能 用 整 型 量 中 
的 一 位 代表 一 种 信号 ， 也 就 是 不 能 用 一 个 整 型 量 表 示 信 号 集 。POSIX.1 定义 数据 类 型 sigset t 
以 包含 一 个 信号 集 ， 并 且 定 义 了 下 列 S 个 处 理 信号 集 的 函数 。 


#include <signal.h> 














int sigemptyset(sigset t *sef) ; 
int sigfillset(sigset t *set); 
int sigaddset(sigset t *set, int signo); 
int sigdelset(sigset t *set, int signo); 
4 个 函数 返回 值 ， 若 成 功 ， 返 回 0; 车 出 错 ， 返 回 -1 

sigismember(const sigset t *sef, int signo); 
返回 值 : 若 真 ， 返 回 1; 若 假 ， 返 回 0 

函数 sigemptyset 初始 化 由 set 指向 的 信号 集 ， 清 除 其 中 所 有 信和 号。 函数 sigfillset 初 
始 化 由 ser 指向 的 信号 集 ， 使 其 包括 所 有 信和 号。 所 有 应 用 程序 在 使 用 信号 集 前 ， 要 对 该 信号 集 调 
用 sigemptyset 或 sigfillset 一 次 。 这 是 因为 C 编译 程序 将 不 赋 初 值 的 外 部 变量 和 静态 变 
量 都 初始 化 为 0， 而 这 是 否 与 给 定 系 统 上 信号 集 的 实现 相对 应 却 并 不 清楚 。 
一 旦 已 经 初始 化 了 一 个 信号 集 ， 以 后 就 可 在 该 信号 集中 增 、 删 特定 的 信号 。 函 数 sigaddset 
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将 一 个 信号 添加 到 已 有 的 信号 集中 ，sigdelset 则 从 信号 集中 删除 一 个 信号 。 对 所 有 以 信号 
作为 参数 的 函数 ， 总 是 以 信号 集 地 址 作为 向 其 传送 的 参数 。 


a XA 
如 果实 现 的 信号 数目 少 于 一 个 整 型 量 所 包含 的 位 数 ， 则 可 用 一 位 代表 一 个 信号 的 方法 实现 信号 集 。 


例如 , 本 书 的 后 续 部 分 都 假定 一 种 实现 有 31 种 信号 和 32 位 整 型 。sigemptyset 函数 将 整 型 设置 为 0， 
sigfillset 函数 则 将 整 型 中 的 各 位 都 设置 为 1。 这 两 个 函数 可 以 在 <signal .h> 头 文件 中 实现 为 宏 : 


#define sigemptyset(ptr) (*(ptr) = 0) 
#define sigfillset (ptr) (*(ptr) = ~(sigset_t)0, 0) 


注意 ， 除 了 设置 信号 集中 各 位 为 1 外 ，sigfillset 必须 返回 0， 所 以 使 用 C 语言 的 逗号 算 符 ， 
它 将 逗号 算 符 后 的 值 作为 表达 式 的 值 返回 。 

使 用 这 种 实现 ，sigaqddset 开启 一 位 (将 该 位 设置 为 D. sigdelset 则 关闭 一 位 (将 该 
位 设置 为 0); sigismember 测试 一 个 指定 的 位 。 因 为 没有 信号 编号 为 0， 所 以 从 信号 编号 中 减 
1 以 得 到 要 处 理 位 的 位 编号 数 。 图 10-12 给 出 了 这 些 函数 的 实现 。 


#include <signal.h> 

#include <errno.h> 

/* 

* <signal.h> usually defines NSIG to include signal number 0. 
ui 

#define SIGBAD (signo) ((signo) <= 0 || (signo) >= NSIG) 

int 


sigaddset (sigset_t *set, int signo) 
{ 
if (SIGBAD(signo)) { 
errno = EINVAL; 
return(-1); 
} 
*set |= 1 << (signo - 1); /* turn bit on */ 
return(0); 


) 


int 
sigdelset(sigset t *set, int signo) 
{ 
if (SIGBAD(signo)) { 
errno = EINVAL; 
return (-1); 
} 
*set &= ~(1 << (signo - 1)); /* turn bit off */ 
return(0); 


int 
sigismember(const sigset t *set, int signo) 
1 
if (SIGBAD(signo)) { 
errno - EINVAL; 
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return(-1); 
} 
return((*set & (1 << (signo - 1))) != 0); 


图 10-12 sigaddset. sigdelset fll sigismember 的 实现 
也 可 将 这 3 个 函数 在 <signal .h> 中 实现 为 各 一 行 的 宏 , 但 是 POSIX.1 要 求 检查 信号 编号 参 
数 的 有 效 性 ， 如 果 无 效 则 设置 errno。 在 宏 中 实现 这 一 点 比 函 数 要 难 。 345 


10.12 AŽ sigprocmask 


10.8 节 曾 提 及 一 个 进程 的 信号 屏蔽 字 规 定 了 当前 阻塞 而 不 能 递送 给 该 进程 的 信号 集 。 调 用 函 
数 sigprocmask 可 以 检测 或 更 改 ， 或 同时 进行 检测 和 更 改进 程 的 信号 屏蔽 字 。 





#include <signal.h> 


int sigprocmask(int how, const sigset t *restrict set, sigset t *restrict oset); 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 
首先 ， 若 oset 是 非 空 指针 ， 那 么 进程 的 当前 信号 屏蔽 字 通 过 oset 返回 。 
其 次 ， 若 set 是 一 个 非 空 指针 ， 则 参数 how 指示 如 何 修改 当前 信号 屏蔽 字 。 图 10-13 说 明了 
how 可 选 的 值 。SIG_BLOCK 是 或 操作 ， 而 SIG_SETMASK 则 是 赋值 操作 。 注意 ， 不 能 阻塞 SIGKILL 
和 SIGSTOP 信号 。 








SIG_BLOCK 该 进程 新 的 信号 屏蔽 字 是 其 当前 信号 屏蔽 字 和 ser 指向 信号 集 的 并 集 。set 包含 了 希 
望 阻塞 的 附加 信号 


SIG_UNBLOCK 该 进程 新 的 信号 屏蔽 字 是 其 当前 信号 屏蔽 字 和 ser 所 指向 信号 集 补 集 的 交集 。sef 包 
含 了 希望 解除 阻塞 的 信号 
SIG_SETMASK 该 进程 新 的 信号 屏蔽 是 set 指 疝 的 值 
图 10-13 用 sigprocmask 更 改 当 前 信号 屏蔽 字 的 方法 
如 果 set 是 个 空 指针 ， 则 不 改变 该 进程 的 信号 屏蔽 字 ，how 的 值 也 无 意义 。 
在 调用 sigprocmask 后 如 果 有 任何 未 决 的 、 不 再 阻塞 的 信号 ， 则 在 sigprocmask 返回 前 ， 
至 少将 其 中 之 一 递送 给 该 进程 。 





sigprocmask 是 仅 为 单线 程 进程 定义 的 。 处 理 多 线程 进程 中 信号 的 屏蔽 使 用 另 一 个 函数 。 
我 们 将 在 12.8 节 中 对 此 进行 讨论 。 


中 实例 
图 10-14 程序 是 一 个 函数 , 它 打印 调用 进程 信号 屏蔽 字 中 的 信号 名 。 图 10-20 中 的 程序 和 图 10-22 


中 的 程序 将 调用 此 函数 。 346 


#include "apue.h" 
#include <errno.h> 


void 
pr_mask(const char *str) 
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sigset_t sigset; 
int errno_save; 


errno_save = errno; /* we can be called by signal handlers */ 
if (sigprocmask(0, NULL, &sigset) < 0) { 
err ret("sigprocmask error"); 
} else 1 
printf ("ts", str); 
if (sigismember (&sigset, SIGINT) ) 
printf(" SIGINT"); 
if (sigismember(&sigset, SIGQUIT) ) 
printf(" SIGQUIT") ; 
if (sigismember(&sigset, SIGUSR1) ) 
printf(" SIGUSR1"); 
if (sigismember(&sigset, SIGALRM)) 
printf(" SIGALRM"); 


/* remaining signals can go here */ 


printf ("Mn"); 


errno - errno save; /* restore errno */ 


图 10-14 ”为 进程 打印 信号 屏蔽 字 
为 了 节省 空间 ， 没 有 对 图 10-1 中 列 出 的 每 一 种 信号 测试 该 屏蔽 字 〈 见 习题 10.9)。 = 


10.13 PAR sigpending 


sigpending 函数 返回 一 信号 集 ， 对 于 调用 进程 而 言 ， 其 中 的 各 信号 是 阻塞 不 能 递送 的 ， 因 
而 也 一 定 是 当前 未 决 的 。 该 信号 集 通过 set 参数 返回 。 
#include <signal.h> 


int sigpending(sigset t *set); 





返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 


PESI 
图 10-15 展示 了 很 多 前 面 说 明 过 的 信和 号 功能 。 
#include "apue.h" 
static void sig_quit(int); 
int 
main (void) 
{ 


sigset_t newmask, oldmask, pendmask; 


if (signal(SIGQUIT, sig_quit) == SIG_ERR) 
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err_sys("can't catch SIGQUIT"); 


/* 
* Block SIGQUIT and save current signal mask. 
xy 
sigemptyset (&newmask) ; 
sigaddset (&newmask, SIGQUIT); 
if (sigprocmask(SIG BLOCK, &newmask, &oldmask) < 0) 
err Sys("SIG BLOCK error"); 


sleep(5); /* SIGQUIT here will remain pending */ 


if (sigpending(&pendmask) < 0) 
err sys("sigpending error"); 

if (sigismember(&pendmask, SIGQUIT)) 
printf("NnSIGQUIT pending Win"); 


/* 
* Restore signal mask which unblocks SIGQUIT. 
* f 
if (sigprocmask(SIG SETMASK, &oldmask, NULL) < 0) 
err sys("SIG SETMASK error"); 
printf("SIGQUIT unblocked\n") ; 


sleep (5); /* SIGQUIT here will terminate with core file */ 
exit (0); 
) 


static void 
sig quit(int signo) 
{ 
printf ("caught SIGQUIT\n"); 
if (signal (SIGQUIT, SIG DFL) == SIG ERR) 
err sys("can't reset SIGQUIT"); 


图 10-15 信号 设置 和 sigprocmask 实例 

进程 阻塞 SIGOUIT 信号 ， 保 存 了 当前 信号 屏蔽 字 《〈 以 便 以 后 恢复 )， 然 后 休眠 5 秒 。 在 此 期 
间 所 产生 的 退出 信号 sicouiT 都 被 阻塞 ， 不 递送 至 该 进程 ， 直 到 该 信号 不 再 被 阻塞 。 在 S 秒 休 
眠 结束 后 ， 检 查 该 信号 是 否 是 未 决 的 ， 然 后 将 SIGQUIT 设置 为 不 再 阻塞 。 

注意 ， 在 设置 SIGQUIT 为 阻塞 时 ， 我 们 保存 了 老 的 屏蔽 字 。 为 了 解除 对 该 信号 的 阻塞 ， 用 
老 的 屏蔽 字 重 新 设置 了 进程 信号 屏蔽 字 (SIG_SETMRASK)。 另 一 种 方法 是 用 SIG_UNBLOCK fi IH 
塞 的 信号 不 再 阻塞 。 但 是 ， 应 当 了 解 如 果 编 写 一 个 可 能 由 其 他 人 使 用 的 函数 ， 而 且 需 要 在 函数 中 
阻塞 一 个 信号 ， 则 不 能 用 STG_UNBLOCK 简单 地 解除 对 此 信和 号 的 阻塞 ， 这 是 因为 此 函数 的 调用 者 
在 调用 本 函数 之 前 可 能 也 阻塞 了 此 信号 。 在 这 种 情况 下 必须 使 用 SIG SETMASK 将 信号 屏蔽 字 恢 
复 为 先前 的 值 ， 这 样 也 就 能 继续 阻塞 该 信号 。10.18 节 的 system 函数 部 分 有 这 样 的 一 个 例子 。 

在 休眠 期 间 如 果 产 生 了 退出 信号 ， 那 么 此 时 该 信号 是 未 决 的 ， 但 是 不 再 受阻 塞 ， 所 以 在 
sigprocmask 返回 之 前 ， 它 被 递送 到 调用 进程 。 从 程序 的 输出 中 可 以 看 到 这 一 点 : SIGQUIT 处 
理 程序 (sig_quit) PH printf 语句 先 执行 , 然后 再 执行 sigprocmask 之 后 的 printf 语句 。 

然后 该 进程 再 休眠 5 秒 。 如 果 在 此 期 间 再 产生 退出 信号 ， 那 么 因为 在 上 次 捕捉 到 该 信号 时 ， 
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已 将 其 处 理 方式 设置 为 默认 动作 ， 所 以 这 一 次 它 束 会 使 该 进程 终止 。 在 下 列 输 出 中 ， 当 我 们 在 终 
端 键入 退出 字符 Ctrl 时 ， 终 端 打印 ^\〈 终 端 退出 字符 ): 


$ ./a.out 

WX 产生 信号 一 次 (在 5s 之 内 ) 
SIGQUIT pending 从 sleep 返回 后 

caught SIGQUIT 在 信号 处 理 程 序 中 
SIGQUIT unblocked 从 sigprocmask 返回 后 
^\Quit (coredump) 再 次 产生 信号 

$ ./a.out 

G aa a AMAN AN AN AN ANAN 产生 信号 10 次 (在 5s 之 内 ) 
SIGQUIT pending 

caught SIGQUIT 只 产生 信号 一 次 

SIGQUIT unblocked 

^\Quit (coredump) 再 产生 信号 


shell 发 现 其 子 进程 异常 终止 时 输出 QUIT (coredump) 信息 。 注 意 ， 第 二 次 运行 该 程序 时 ， 
在 进程 休眠 期 间 使 SIGOUIT 信号 产生 了 10 次 , 但 是 解除 了 对 该 信号 的 阻塞 后 ， 只 向 进程 传送 一 
次 sSIGQUIT。 从 中 可 以 看 出 在 此 系统 上 没有 将 信号 进行 排队 。 m 


10.14 PAR sigaction 


sigaction 函数 的 功能 是 检查 或 修改 〈 或 检查 并 修改 ) 与 指定 信和 号 相关 联 的 处 理 动作 。 此 函 
数 取 代 了 UNIX 早期 版 本 使 用 的 signal 函数 。 在 本 节 末 尾 用 sigaction 函数 实现 了 signal. 
#include <signal.h> 


int sigaction(int signo, const struct sigaction *restrict act, 
struct sigaction *restrict oact); 





返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 --1 
其 中 ， 参 数 signo 是 要 检测 或 修改 其 具体 动作 的 信号 编号 。 若 act 指针 非 空 ， 则 要 修改 其 动作 。 
如 果 oact 指针 非 空 ， 则 系统 经 由 oact 指针 返回 该 信号 的 上 一 个 动作 。 此 函数 使 用 下 列 结构 : 








struct sigaction { 


void (*sa_handler) (int); /* addr of signal handler, */ 

/* or SIG IGN, or SIG DFL */ 
Sigset t sa mask; /* additional signals to block */ 
int sa flags; /* signal options, Figure 10.16 */ 
/* alternate handler */ 
void (*sa sigaction) (int, siginfo t *, void *); 


}; 

当 更 改 信 号 动作 时 ， 如 果 sa handler 字段 包含 一 个 信号 捕捉 函数 的 地 址 〈 不 是 常量 
SIG_IGN 或 SIG_DFL)， 则 sa mask 字段 说 明了 一 个 信号 集 ， 在 调用 该 信号 捕捉 函数 之 前 ， 这 
一 信号 集 要 加 到 进程 的 信和 号 屏蔽 字 中 。 仅 当 从 信号 捕捉 函数 返回 时 再 将 进程 的 信和 号 屏蔽 字 恢 复 为 
原先 值 。 这 样 ， 在 调用 信和 号 处 理 程 序 时 就 能 阻塞 某 些 信号 。 在 信和 号 处 理 程序 被 调用 时 ， 操 作 系 统 
建立 的 新 信号 屏蔽 字 包括 正 被 递送 的 信号 。 因 此 保证 了 在 处 理 一 个 给 定 的 信号 时 ， 如 果 这 种 信号 
再 次 发 生 ， 那 么 它 会 被 阻塞 到 对 前 一 个 信号 的 处 理 结 束 为 止 。 回 忆 10.8 节 ， 若 同一 种 信号 多 次 发 
生 ， 通 常 并 不 将 它们 加 入 队列 ， 所 以 如 果 在 某 种 信号 被 阻塞 时 ， 它 发 生 了 5 次 ， 那 么 对 这 种 信号 
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解除 阻塞 后 ， 其 信号 处 理 函 数 通常 只 会 被 调用 一 次 〈 上 一 个 例子 已 经 说 明了 这 种 特性 )。 

一 旦 对 给 定 的 信号 设置 了 一 个 动作 ， 那 么 在 调用 sigaction 显 式 地 改变 它 之 前 ， 该 设置 就 
一 直 有 效 。 这 种 处 理 方式 与 早期 的 不 可 靠 信 号 机 制 不 同 ， 符 合 POSIX.1 在 这 方面 的 要 求 。 

act 结构 的 sa_flags 字段 指定 对 信和 号 进行 处 理 的 各 个 选项 。 图 10-16 详细 列 出 了 这 些 选项 
的 意义 。 若 该 标志 已 定义 在 基本 POSIX.1 标准 中 ， 那 么 SUS PLA “9”; 若 该 标志 定义 在 基本 
POSIX.1 标准 的 XSI 扩展 中 ， 那 么 该 列 包 含 “XSI”。 


FreeBSD Linux MacOS Solaris R 
uid 20 3:20 * IER m 


SA INTERRUPT 由 此 信号 中 断 的 系统 调用 不 自动 重启 
动 (XSI 对 于 sigaction 的 默认 处 理 方 
xD. 详 见 10.5 节 
SA_NOCLDSTOP 若 signo 是 SIGCHLD, 当 子 进程 停止 ( 作 
业 控制 )， 不 产生 此 信号 。 当 子 进 程 终止 
上 时， 仍旧 产生 此 信号 〈 但 请 参阅 下 面 说 
明 的 sa NocLDwAIT 选项 )。 若 已 设置 
此 标志 ， 则 当 停 止 的 进程 继续 运行 时 ， 
作为 XSI 扩展， 不 产生 SIGCHLD 信号 
SA_NOCLDWAIT 35 signo 是 SIGCHLD， 则 当 调 用 进程 
的 子 进 程 终止 时 ， 不 创建 僵 死 进程 。 若 
调用 进程 随后 调用 wait， 则 阻塞 到 它 所 
有 子 进程 都 终止 ， 此 时 返回 -1，errno 
设置 为 ECHILD ( 见 10.7 节 ) 





SA_NODEFER 当 捕 捉 到 此 信号 时 ， 在 执行 其 信号 捕 


捉 函 数 时 ， 系 统 不 自动 阻塞 此 信号 CER 
JË sa_mask 包括 了 此 信号 )。 注 意 ， 此 
种 类 型 的 操作 对 应 于 早期 的 不 可 靠 信 号 
SA_ONSTACK 若 用 sigaltstack(2) 已 声明 了 一 
替换 栈 ， 则 此 信号 递送 给 替换 栈 上 的 进程 
SA_RESETHAND 在 此 信和 号 捕捉 函数 的 入 口 处 ， 将 此 信和 号 
的 处 理 方式 重 置 为 SIG_DEL， 并 清除 
SA_SIGINFO 标志 。 注 意 ， 此 种 类 型 的 信 
号 对 应 于 早期 的 不 可 靠 信和 号。 但 是 ， 不 能 
自动 重 置 SIGILL 和 SIGTRAP 这 两 个 信 
号 的 配置 。 设 置 此 标志 使 sigaction 的 
行为 如 同 设置 了 SA_LNODEFER 标志 
SA_RESTART 由 此 信号 中 断 的 系统 调用 自动 重启 动 
(参见 10.5 节 ) 
SA_SIGINFO 此 选项 对 信号 处 理 程序 提供 了 附加 信 
息 : 一 个 指向 siginfo 结构 的 指针 以 及 
一 个 指向 进程 上 下 文 标识 符 的 指针 


图 10-16 ”处 理 每 个 信号 的 可 选 标志 (sa flags) 
sa .sigasbion 字段 是 一 个 替代 的 信和 号 处 理 程序 ， 在 sigaction 结构 中 使 用 了 SA SIGINFO 
标志 时 ， 使 用 该 信号 处 理 程序 。 对 于 sa_sigaction 字段 和 sa_handler 字段 两 者 ， 实 现 可 能 
使 用 同一 存储 区 ， 所 以 应 用 只 能 一 次 使 用 这 两 个 字段 中 的 一 个 。 
通常 ， 按 下 列 方 式 调 用 信和 号 处 理 程序 : 
void handler(int sigmo); 


但 是 ， 如 果 设 置 了 SA siGINFO 标志 ， 那 么 按 下 列 方式 调用 信和 号 处 理 程序 : 


void handler(int signo, siginfo_t *info, void *context) ; 
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siginfo 结构 包含 了 信号 产生 原因 的 有 关 信 息 。 该 结构 的 大 致 样式 如 下 所 示 。 符 合 POSIX.1 的 
所 有 实现 必须 至 少 包 括 si_signo 和 si code Mi. FH, FFA XSI 的 实现 至 少 应 包含 下 列 字段 : 


struct siginfo { 


int si_signo; /* 
int si errno;  /* 
int si code; y* 
pid t si pid; p* 
uid t si uid; es 
void *si_addr; y* 
int si status; /* 
union sigval si value;  /* 


signal number */ 

if nonzero, errno value from «errno.h» */ 
additional info (depends on signal) */ 
sending process ID */ 

sending process real user ID */ 

address that caused the fault */ 

exit value or signal number */ 
application-specific value */ 


/* possibly other fields also */ 


}; 
sigval 联合 包含 下 列 字 段 : 


int sival_int; 
void *sival_ptr; 


应 用 程序 在 递送 信号 时 ， 在 si_value.sival_int 中 传递 一 个 整 型 数 或 者 在 si value.sival ptr 


中 传递 一 个 指针 值 。 


图 10-17 示 出 了 对 于 各 种 信号 的 si_code 值 ， 这 些 信号 是 由 Single UNIX Specification 定义 
的 。 注 意 ， 实 现 可 定义 附加 的 代码 值 。 

若 信号 是 SIGCHLD， 则 将 设置 si pid. si status 和 si uid 字段 。 若 信号 是 SIGBUS. 
SIGILL, SIGFPE 或 SIGSEGV， 则 si_addr 包含 造成 故障 的 根源 地 址 ， 该 地 址 可 能 并 不 准确 。 
si_errno 字段 包含 错误 编号 ， 它 对 应 于 造成 信号 产生 的 条 件 ， 并 由 实现 定义 。 

信号 处 理 程序 的 context 参数 是 无 类 型 指针 , 它 可 被 强制 类 型 转换 为 ucontext t 结构 类 型 ， 
该 结构 标识 信号 传递 时 进程 的 上 下 文 。 该 结构 至 少 包 含 下 列 字段 : 


ucontext_t *uc_link; /* 
/* 
sigset t uc sigmask; /* 
/* 
stack t uc stack; gx 
mcontext_t uc_mcontext; /* 
/* 


pointer to context resumed when */ 
this context returns */ 

signals blocked when this context */ 
is active */ 

Stack used by this context */ 
machine-specific representation of */ 
saved context */ 


uc stack 字段 描述 了 当前 上 下 文 使 用 的 栈 ， 至 少 包 括 下 列 成 员 : 


void *ss_sp; /* 
size t ss size; 7* 
int ss flags; r* 


stack base or pointer */ 
stack size */ 
flags */ 


当 实 现 支持 实时 信号 扩展 时 ,用 SA SIGINFO 标志 建立 的 信号 处 理 程序 将 造成 信号 可 靠 地 排 
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) 队 。 一 些 保留 信号 可 由 实时 应 用 使 用 。 如 果 信 号 由 sigqueue mA "E, ARA siginfo 结构 能 
353 包含 应 用 特有 的 数据 ( 参见 10.20 节 )。 


a KB: signal PB 


现在 用 sigaction 实现 signal 函数 。 很 多 平台 都 是 这 样 做 的 《POSIX.1 的 基础 阐述 部 分 
也 说 明 这 是 POSIX 所 希望 的 )。 另 一 方面 ， 有 些 系统 支持 老 的 不 可 靠 信 号 语义 signal MR, 
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其 目的 是 实现 二 进 制 向 后 兼容 。 除 非特 殊 地 要 求 老 的 不 可 靠 语 义 (为 了 向 后 兼容 )， 否 则 应 当 使 
用 下 面 的 signal 实现 ， 或 者 直接 调用 sigaction (可 以 在 调用 sigaction 时 指定 
SA_RESETHAND 和 SA_NODEFER 选项 以 实现 老 语 义 的 signal 函数 )。 本 书 中 所 有 调用 signal 
的 实例 均 调用 图 10-18 中 实现 的 函数 。 


ILL_ILLOPC 非法 操作 码 
ILL_ILLOPN 非法 操作 数 
ILL_ILLADR 非法 地 址 模式 
ILL_ILLTRP 非法 陷入 
ILL_PRVOPC 特权 操作 码 
ILL_PRVREG 特权 寄存 器 
ILL_COPROC 协 处 理 器 出 错 
ILL_BADSTK 内 部 栈 出 错 
FPE_INTDIV 整数 除 以 0 
FPE_INTOVF 整数 溢出 
FPE_FLTDIV 浮 点 除 以 0 
浮 点 向 上 溢出 
浮 点 向 下 溢出 
浮 点 不 精确 结果 
无 效 浮 点 操作 
下 标 超 出 范围 


无 效 地 址 对 齐 
不 存在 的 物理 地 址 
对 象 特定 硬件 错 


子 进程 已 终止 
子 进程 已 异常 终止 (无 core) 
子 进程 已 异常 终止 (有 core) 
被 跟踪 子 进程 已 陷入 
CLD_STOPPED 子 进程 已 停止 
CLD_CONTINUED 停止 的 子 进程 已 继续 
SI_USER kill 发 送 的 信号 
SI_QUEUE sigqueue 发 送 的 信号 
SI_TIMER timer settime 设置 的 定时 器 超时 (实时 扩展 ) 
SI_ASYNCIO 异步 VO 请 求 完成 (实时 扩展 ) 
SI MESGQ 一 条 消息 到 达 消 息 队 列 〈 实 时 扩展 ) 


图 10-17 siginfo_t 代码 值 








#include "apue.h" 


/* Reliable version of signal(), using POSIX sigaction(). */ 
Sigfunc * 
signal(int signo, Sigfunc *func) 


{ 


struct sigaction act, oact; 
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act.sa handler = func; 
sigemptyset (&act.sa_mask) ; 
act.sa_flags = 0; 


if (signo == SIGALRM) { 
#ifdef SA_INTERRUPT 
act.sa_flags |= SA_INTERRUPT; 
#endif 
} else { 
act.sa_flags |= SA_RESTART; 


} 

if (sigaction (signo, &act, &oact) < 0) 
return (SIG_ERR) ; 

return (oact.sa_handler) ; 


10-18 JH sigaction 实现 的 signal mR 

注意 , 必须 用 sigemptyset 函数 初始 化 act 结构 的 sa mask 成 员 。 不 能 保证 act .sa_mask=0 
会 做 同样 的 事情 。 

对 除 SIGALRM 以 外 的 所 有 信和 号， 我 们 都 有 意 尝 试 设置 SA_RESTART 标志 ， 于 是 被 这 些 信 号 
中 断 的 系统 调用 都 能 自动 重启 动 。 不 希望 重启 动 由 SIGALRM 信号 中 断 的 系统 调用 的 原因 是 : 我 
们 希望 对 LO 操作 可 以 设置 时 间 限 制 ( 请 回忆 有 关 图 10-10 的 讨论 )。 

某 些 早期 系统 (如 SunOS) 定义 了 SA_INTERRUPT 标志 。 这 些 系统 的 默认 方式 是 重新 启动 
被 中 断 的 系统 调用 ， 而 指定 此 标志 则 使 系统 调用 被 中 断后 不 再 重启 动 。Linux 定义 SA_INTERRUPT 
标志 ， 以 便 与 使 用 该 标志 的 应 用 程序 兼容 。 但 是 ， 如 车 信号 处 理 程序 是 用 sigaction 设置 的 ， 
那么 其 默认 方式 是 不 重新 启动 系统 调用 。Single UNIX Specification 的 XSI 扩展 规定 ， 除 非 说 明了 
SA RESTART hk, filli sigaction 函数 不 再 重启 动 被 中 断 的 系统 调用 。 č 


m Xil: signal intr KA 
图 10-19 给 出 的 是 signal 函数 的 另 一 种 版 本 ， 它 力图 阻止 被 中 断 的 系统 调用 重启 动 。 


#include "apue.h" 


Sigfunc * 
signal_intr(int signo, Sigfunc *func) 
{ 

struct sigaction act, oact; 


act.sa_handler = func; 
sigemptyset (&act.sa_mask) ; 
act.sa_flags = 0; 
#ifdef SA_INTERRUPT 
ct.sa_flags |= SA_INTERRUPT; 
#endif 
if (sigaction(signo, &act, &oact) < 0) 
return(SIG ERR); 
return(oact.sa handler); 








图 10-19 signal intr AR 
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如 果 系 统 定义 了 SA_INTERRUPT 标志 ， 那 么 为 了 提高 可 移植 性 ， 我 们 在 sa_flags 中 增加 
该 标志 ， 这 样 也 就 阻止 了 被 中 断 的 系统 调用 的 重启 动 。 = 


10.15 PAH sigsetjmp 和 siglongjmp 


7.10 节 说 明了 用 于 非 局 部 转移 的 setjmp 和 longjmp 函数 。 在 信号 处 理 程序 中 经 常 调用 
longjmp 函数 以 返回 到 程序 的 主 循环 中 ， 而 不 是 从 该 处 理 程 序 返 回 。 图 10-8 和 图 10-11 中 已 经 出 
现 了 这 种 情况 。 

但 是 ， 调 用 1ongjmp 有 一 个 问题 。 当 捕捉 到 一 个 信号 时 ， 进 入 信和 号 捕捉 函数 ， 此 时 当前 信和 号 
被 自动 地 加 到 进程 的 信号 屏蔽 字 中 。 这 阻止 了 后 来 产生 的 这 种 信号 中 断 该 信号 处 理 程序 。 如 果 用 
longjmp 跳出 信号 处 理 程 序 ， 那 么 ， 对 此 进程 的 信号 屏蔽 字 会 发 生 什么 呢 ? 

在 FreeBSD 8.0 f Mac OS X 10.6.8 中 ，setjmp 和 longjmp 保存 和 恢复 信号 屏蔽 字 。 但 是 ， 
Linux 3.2.0 和 Solaris 10 并 不 执行 这 种 操作 ， 虽 然 Linux 支持 提供 BSD 行为 的 选项 。FreeBSD 8.0 
和 Mac OS X 10.6.8 提供 函数 set jmp 和 _longjmp， 它 们 也 不 保存 和 恢复 信号 屏蔽 字 。 


为 了 允许 两 种 形式 并 存 ，POSIX.1 并 没有 指定 setjmp 和 1ongjmp 对 信号 屏蔽 字 的 作用 ， 
而 是 定义 了 两 个 新 函数 sigsetjmp 和 siglongjmp. 在 信号 处 理 程序 中 进行 非 局 部 转移 时 应 当 
使 用 这 两 个 函数 。 355 


#include <setjmp.h> 





int sigsetjmp(sigjmp buf env, int savemask) ; 
返回 值 ， 若 直接 调用 ， 返 回 0， 若 从 siglongjmp 调用 返回 ， 则 返回 非 0 

void siglongjmp(sigjmp buf env, int val); 
这 两 个 函数 和 setjmp. longjmp 之 间 的 唯一 区 别 是 sigsetjmp 增加 了 一 个 参数 。 如 果 
savemask ÌE 0, Wl] sigsetjmp Æ env 中 保存 进程 的 当前 信和 号 屏蔽 字 。 调 用 siglongjmp 时 ， 如 果 带 
JE 0 savemask 的 sigsetjmp 调用 已 经 保存 了 env， 则 siglongjmp 从 其 中 恢复 保存 的 信号 屏 珊 字 。 











s XP 
图 10-20 中 的 程序 演示 了 在 信号 处 理 程序 被 调用 时 ， 系 统 所 设置 的 信号 屏蔽 字 如 何 自 动 地 包 
括 刚 被 捕捉 到 的 信号 。 此 程序 也 示例 说 明了 如 何 使 用 sigsetjmp 和 siglongjmp 函数 。 








#include "apue.h" 
#include <setjmp.h> 
#include <time.h> 


static void sig usrl(int); 
static void sig alrm(int); 
static sigjmp buf jmpbuf; 


static volatile sig atomic t canjump; 


int 
main(void) 
{ 
if (signal(SIGUSR1, sig_usrl) == SIG ERR) 
err_sys("signal(SIGUSR1) error"); 
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if (signal (SIGALRM, sig alrm) == SIG_ERR) 
err_sys ("signal (SIGALRM) error"); 


pr_mask("starting main: "); /* Figure 10.14 */ 
if (sigsetjmp(jmpbuf, 1)) { 
pr_mask ("ending main: "); 
exit (0); 
} 
canjump = 1; /* now sigsetjmp() is OK */ 
for (7% ) 


pause (); 
} 


static void 


sig usrl(int signo) 
{ 


time 七 starttime; 


if (canjump == 0) 


return; /* unexpected signal, ignore */ 
pr_mask("starting sig_usrl: "); 
alarm(3); /* SIGALRM in 3 seconds */ 
starttime = time (NULL); 
for L Ara /* busy wait for 5 seconds */ 

if (time(NULL) > starttime + 5) 

break; 

pr_mask("finishing sig_usrl: "); 


canjump = 0; 
siglongjmp(jmpbuf, 1);/* jump back to main, don't return */ 
} 


static void 
sig_alrm(int signo) 
{ 


pr_mask("in sig_alrm: "); 


} 
图 10-20 信号 屏蔽 、sigsetjmp 和 siglongjmp 实例 

此 程序 演示 了 男 一 种 技术 ， 只 要 在 信号 处 理 程 序 中 调用 siglongjmp 就 应 使 用 这 种 技术 。 
仅 在 调用 sigsetjmp 之 后 才 将 变量 canjump 设置 为 非 0 值 。 在 信号 处 理 程序 中 检测 此 变量 ， 
仅 当 它 为 非 0 值 时 才 调 用 siglongjmp。 这 提供 了 一 种 保护 机 制 ， 使 得 在 jmpbuf( 跳 转 缓冲 ) 
尚未 由 sigsetjmp 初始 化 时 ， 防 止 调 用 信号 处 理 程序 。( 在 本 程序 中 ，siglongjmp 之 后 程序 
很 快 就 结束 ， 但 是 在 较 大 的 程序 中 ， 在 siglongjmp 之 后 的 较 长 一 段 时 间 内 ， 信 和 号 处 理 程序 可 
能 仍旧 被 设置 )。 在 一 般 的 C 代码 中 不 是 信号 处 理 程序 )， 对 于 1ongjmp 并 不 需要 这 种 保护 措 
施 。 但 是 ， 因 为 信号 可 能 在 任何 时 候 发 生 ， 所 以 在 信号 处 理 程序 中 ， 需 要 这 种 保护 措施 。 
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在 程序 中 使 用 了 数据 类 型 sig atomic t， 这 是 由 ISO C 标准 定义 的 变量 类 型 ， 在 写 这 种 类 
型 变量 时 不 会 被 中 断 。 这 意味 着 在 具有 虚拟 存储 器 的 系统 上 ， 这 种 变量 不 会 跨越 页 边界 ， 可 以 用 
一 条 机 器 指令 对 其 进行 访问 。 这 种 类 型 的 变量 总 是 包括 ISO 类 型 修饰 符 volatile， 其 原因 是 : 该 
变量 将 由 两 个 不 同 的 控制 线程 一 一 main 函数 和 异步 执行 的 信号 处 理 程序 访问 。 图 10-21 显示 了 此 
程序 的 执行 时 间 顺 序 。 可 将 图 10-21 分 成 三 部 分 : 左面 部 分 (对 应 于 main), 中 间 部 分 (sig_usr1) 
和 右面 部 分 (sig_alrm)。 在 进程 执行 左面 部 分 时 ， 信 号 屏蔽 字 是 0 (没有 信号 是 阻塞 的 )。 而 执 
行 中 间 部 分 时 ， 其 信号 屏蔽 字 是 SIGUSR1。 执 行 右面 部 分 时 ， 信 号 屏蔽 字 是 SIGUSR1 | SIGALRM. 








- 
main 
signal() 
signal() 
r mask() 
sigsetjmp() 
pause() 
SIGUSRI 递送 
r mask 
Pa 
time() 
time() 
time() 
ý SIGALRM 递送 : 
pr mask() 
-——— ————————————— return 
CU 从 信号 处 再 程 序 中 返回 
pr mask() 
sigsetjmp() siglongjmp() 
pr mask() 
exit() 


图 10-21 处理 两 个 信号 的 实例 程序 的 时 间 顺 序 
执行 图 10-20 程序 ， 得 到 下 面 的 输出 : 


$ ./a.out & 在 后 台 启 动 进程 

starting main: 

[1] 531 作业 控制 shell 打印 其 进程 ID 
$ kill -USR1 531 向 该 进程 发 送 STGUSR1 


starting sig usrl: SIGUSR1 

$ in sig alrm: SIGUSR1 SIGALRM 

finishing sig usrl: SIGUSRI 

ending main: 

键入 回 车 

[1] + Done ./a.out & 
该 输出 与 我 们 所 期 望 的 相同 : 当 调 用 一 个 信号 处 理 程 序 时 ， 被 捕捉 到 的 信号 加 到 进程 的 当前 信和 号 
屏蔽 字 中 。 当 从 信和 号 处 理 程序 返回 时 ， 恢 复原 来 的 屏蔽 字 。 另 外 ，siglongjmp 恢复 了 由 
sigsetjmp 所 保存 的 信号 屏蔽 字 。 

如 果 在 Linux 中 将 图 10-20 程序 中 的 sigsetjmp 和 siglongjmp 分 别 替 换 成 setjmp 和 
longjmp (在 FreeBSD 中 ， 则 替换 成 _setjmp 和 _l1ongjmp)， 则 最 后 一 行 输出 变 成 : 


ending main: SIGUSR1 


这 意味 着 在 调用 setjmp 之 后 执行 main 函数 时 ， 其 SIGUSR1 是 阻塞 的 。 这 多 半 不 是 我 们 所 
希望 的 。 5 
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10.16 函数 sigsuspend 


上 面 已 经 说 明 ， 更 改进 程 的 信号 屏蔽 字 可 以 阻塞 所 选择 的 信号 ， 或 解除 对 它们 的 阻塞 。 使 用 这 种 
技术 可 以 保护 不 希望 由 信号 中 断 的 代码 临界 区 。 如 果 希 望 对 一 个 信号 解除 阻塞 ， 然 后 pause 以 等 待 
以 前 被 阻塞 的 信号 发 生 ， 则 又 将 如 何 呢 ? 假定 信号 是 SIGINT， 实 现 这 一 点 的 一 种 不 正确 的 方法 是 : 


Sigset 七 newmask, oldmask; 

sigemptyset (&newmask) ; 

sigaddset (&newmask, SIGINT); 

/* block SIGINT and save current signal mask */ 

if (sigprocmask(SIG_BLOCK, &newmask, &oldmask) < 0) 
err_sys("SIG_BLOCK error"); 

/* critical region of code */ 

/* restore signal mask, which unblocks SIGINT */ 

if (sigprocmask(SIG SETMASK, &oldmask, NULL) < 0) 
err Sys("SIG SETMASK error"); 

/* window is open */ 

pause(); /* wait for signal to occur */ 

/* continue processing */ 


如 果 在 信号 阻塞 时 ， 产 生 了 信号， 那么 该 信号 的 传递 就 被 推迟 直到 对 它 解除 了 阻塞 。 对 应 用 
程序 而 言 ， 该 信号 好 像 发 生 在 解除 对 SIGINT 的 阻塞 和 pause 之 间 【〈 取 决 于 内 核 如 何 实现 信号 )。 
如 果 发 生 了 这 种 情况 ， 或 者 如 果 在 解除 阻塞 时 刻 和 pause 之 间 确 实 发 生 了 信号 ， 那 么 就 会 产生 
问题 。 因 为 可 能 不 会 再 见 到 该 信号 ， 所 以 从 这 种 意义 上 讲 ， 在 此 时 间 窗 口中 发 生 的 信号 丢失 了 ， 
这 样 就 使 得 pause 永远 阻塞 。 这 是 早期 的 不 可 靠 信 号 机 人 制 的 另 一 个 问题 。 

为 了 纠正 此 问题 ， 需 要 在 一 个 原子 操作 中 先 恢复 信号 屏蔽 字 ， 然 后 使 进程 休眠 。 这 种 功能 是 
由 sigsuspend 函数 所 提供 的 。 


#include <signal.h> 





int sigsuspend(const sigset_t *sigmask) ; 





返回 值 : -1， 并 将 errno 设置 为 EINTR 
进程 的 信号 屏蔽 字 设 置 为 由 sigmask 指向 的 值 。 在 捕捉 到 一 个 信号 或 发 生 了 一 个 会 终止 该 进 
程 的 信号 之 前 , 该 进程 被 挂 起 。 如果 捕捉 到 一 个 信号 而 且 从 该 信号 处 理 程序 返回 , 则 sigsuspend 
返回 ， 并 且 该 进程 的 信号 屏蔽 字 设 置 为 调用 sigsuspend 之 前 的 值 。 
注意 ， 此 函数 没有 成 功 返 回 值 。 如 果 它 返回 到 调用 者 ， 则 总 是 返回 -1， 并 将 errno 设置 为 
359] EINTR (表示 一 个 被 中 断 的 系统 调用 )。 


m BA 
图 10-22 显示 了 保护 代码 临界 区 ， 使 其 不 被 特定 信号 中 断 的 正确 方法 。 





#include "apue.h" 
static void sig_int(int); 
int 


main (void) 


{ 
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sigset t newmask, oldmask, waitmask; 
pr mask("program start: "); 


if (signal(SIGINT, sig int) -- SIG ERR) 
err sys("signal(SIGINT) error"); 
sigemptyset(&waitmask); 
sigaddset(&waitmask, SIGUSR1); 
sigemptyset (&newmask); 
sigaddset(&newmask, SIGINT); 


/* 

* Block SIGINT and save current signal mask. 

i7 

if (sigprocmask(SIG BLOCK, &newmask, &oldmask) < 0) 
err Sys("SIG BLOCK error"); 


/* 
* Critical region of code. 
sa 
pr_mask("in critical region: "); 


/* 
* Pause, allowing all signals except SIGUSRI1. 
x 
if (sigsuspend(&waitmask) !- -1) 
err sys("sigsuspend error"); 
pr mask("after return from sigsuspend: "); 
/* 
* Reset signal mask which unblocks SIGINT. 
x7 


if (sigprocmask(SIG SETMASK, &oldmask, NULL) < 0) 
err Sys("SIG SETMASK error"); 


/* 
* And continue processing ... 
Ss 


pr mask("program exit: "); 


exit(0); 


static void 
sig int(int signo) 


pr_mask("\nin sig int: "); 


图 10-22 ”保护 临界 区 不 被 信号 中 断 


注意 ， 当 sigsuspend 返回 时 ， 它 将 信号 屏蔽 字 设 置 为 调用 它 之 前 的 值 。 在 本 例 中 ，SIGINT 
信号 将 被 阻塞 。 因 此 将 信和 号 屏蔽 恢复 为 之 前 保存 的 值 (oldmasky)。 


运行 图 10-22 中 的 程序 得 到 下 面 的 输出 : 
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$ ./a.out 

program start: 

in critical region: SIGINT 

^C 键入 中 断 字 符 
in sig int: SIGINT SIGUSR1 

after return from sigsuspend: SIGINT 
program exit: 


在 调用 sigsuspend 时 , 将 SIGUSRI 信和 号 加 到 了 进程 信号 屏蔽 字 中 ， 所 以 当 运 行 该 信号 处 理 程 
序 时 ， 我 们 得 知 信和 号 屏蔽 字 已 经 改变 了 。 从 中 可 见 ， 在 sigsuspend 返回 时 ， 它 将 信号 屏蔽 字 


恢复 为 调用 它 之 前 的 值 。 E 
TEA) 


sigsuspend 的 另 一 种 应 用 是 等 待 一 个 信号 处 理 程序 设置 一 个 全 局 变量 。 图 10-23 中 的 程序 
用 于 捕捉 中 断 信号 和 退出 信号 ， 但 是 希望 仅 当 捕 提 到 退出 信号 时 ， 才 唤醒 主 例 程 。 


#include "apue.h" 
volatile sig_atomic_t quitflag; /* set nonzero by signal handler */ 


static void 
sig_int(int signo) /* one signal handler for SIGINT and SIGQUIT */ 
{ 
if (signo == SIGINT) 
printf ("\ninterrupt\n") ; 
else if (signo == SIGQUIT) 
quitflag = 1; /* set flag for main loop */ 


int 
main (void) 
{ 


sigset_t newmask, oldmask, zeromask; 


if (signal(SIGINT, sig_int) == SIG_ERR) 
err_sys("signal(SIGINT) error"); 
if (signal(SIGQUIT, sig int) == SIG ERR) 


err sys("signal(SIGQUIT) error"); 


sigemptyset (&zeromask); 
sigemptyset (&newmask) ; 
sigaddset (&newmask, SIGQUIT); 


/* 
* Block SIGQUIT and save current signal mask. 
my 
if (sigprocmask(SIG BLOCK, &newmask, &oldmask) < 0) 
err_sys ("SIG BLOCK error"); 


while (quitflag == 0) 
sigsuspend(&zeromask); 


/* 
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* SIGQUIT has been caught and is now blocked; do whatever. 
xj 
quitflag = 0; 


/* 
* Reset signal mask which unblocks SIGQUIT. 
wy 
if (sigprocmask(SIG SETMASK, &oldmask, NULL) < 0) 
err sys("SIG SETMASK error"); 





exit(0); 
} 
图 10-23 用 sigsuspend 等 待 一 个 全 局 变量 被 设置 
此 程序 的 样本 输出 是 : 
$ ./a.out 
AC 键入 中 断 字 符 
interrupt 
^C 再 次 键入 中 断 字 符 
interrupt 
^c 再 一 次 
interrupt 
“\$ 用 退出 符 终 止 


考虑 到 支持 ISO C 的 非 POSIX 系统 与 POSIX 系统 两 者 之 间 的 可 移植 性 ， 在 一 个 信号 处 理 程 
序 中 唯一 应 当做 的 是 为 sig_atomic t 类 型 的 变量 赋 一 个 值 。 POSIX.1 规定 得 更 多 一 些 ， 它 详细 
说 明了 在 一 个 信号 处 理 程序 中 可 以 安全 地 调用 的 函数 列表 ( 见 图 10-4 ), 但 是 如 果 这 样 来 编写 代码 ， 
则 它们 可 能 不 会 正确 地 在 非 POSIX 系统 上 运行 。 


we KB 


可 以 用 信和 号 实现 父 、 子 进程 之 间 的 同步 ， 这 是 信号 应 用 的 另 一 个 实例 。 10-24 给 出 了 8.9 
节 中 提 到 的 5 个 例 程 的 实现 , 它们 是 TELLWAIT. TELL PARENT. TELL CHILD. WAIT PARENT 
和 WAIT_CHILD。 362 


#include "apue.h" 


static volatile sig_atomic_t sigflag; /* set nonzero by sig handler */ 
static sigset_t newmask, oldmask, zeromask; 


static void 
sig_usr(int signo) /* one signal handler for SIGUSR1 and SIGUSR2 */ 
{ 
sigflag = 1; 
} 


void 
TELL_WAIT (void) 
{ 
if (signal(SIGUSR1, sig_usr) == SIG_ERR) 
err_sys("signal(SIGUSR1) error"); 


290 410% 信和 号 





if (signal(SIGUSR2, sig_usr) == SIG_ERR) 
err_sys ("signal (SIGUSR2) error"); 

sigemptyset (&zeromask) ; 

sigemptyset (&newmask) ; 

sigaddset (&newmask, SIGUSR1); 

sigaddset (&newmask, SIGUSR2); 


/* Block SIGUSR1 and SIGUSR2, and save current signal mask */ 
if (sigprocmask(SIG BLOCK, &newmask, &oldmask) < 0) 
err sys("SIG BLOCK error"); 


void 
TELL PARENT (pid t pid) 
{ 
kill(pid, SIGUSR2); /* tell parent we're done */ 


void 
WAIT PARENT (void) 
{ 
while (sigflag == 0) 
sigsuspend(&zeromask); /* and wait for parent */ 
sigflag = 0; 


/* Reset signal mask to original value */ 
if (sigprocmask(SIG SETMASK, &oldmask, NULL) < 0) 
err Sys("SIG SETMASK error"); 


void 
TELL CHILD(pid t pid) 
{ 
kill(pid, SIGUSR1); /* tell child we're done */ 


void 
WAIT_CHILD (void) 
{ 
while (sigflag == 0) 
sigsuspend(&zeromask); /* and wait for child */ 
sigflag = 0; 


/* Reset signal mask to original value */ 
if (sigprocmask(SIG SETMASK, &oldmask, NULL) < 0) 
err sys("SIG SETMASK error"); 


图 10-24 ”父子 进程 可 用 来 实现 同步 的 例 程 
其 中 使 用 了 两 个 用 户 定义 的 信号 : SIGUSR1 由 父 进 程 发 送 给 子 进程 ，sSIGUSR2 由 子 进程 发 
送 给 父 进程 。 图 15-7 显示 了 使 用 管道 的 这 5 个 函数 的 另 一 种 实现 。 " 
如 果 在 等 待 信号 发 生 时 希望 去 休眠 ， 则 使 用 sigsuspend 函数 是 非常 适当 的 (正如 在 前 面 
两 个 例子 中 所 示 )， 但 是 如 果 在 等 待 信号 期 间 希 望 调用 其 他 系统 函数 ， 那 么 将 会 怎样 呢 ? 遗憾 的 
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是 ， 在 单线 程 环境 下 对 此 问题 没有 妥善 的 解决 方法 。 如 果 可 以 使 用 多 线程 ， 则 可 专门 安排 一 个 线 
程 处 理 信 号 〈 见 12.8 节 中 的 讨论 )。 

如 果 不 使 用 线程 ， 那 么 我 们 能 尽力 做 到 最 好 的 是 ， 当 信号 发 生 时 ， 在 信和 号 捕捉 程序 中 对 一 个 
全 局 变量 置 1。 例 如 ， 若 我 们 捕捉 SIGINT 和 SIGALRM 这 两 种 信号 ， 并 用 signal intr 函数 
设置 这 两 个 信号 的 处 理 程序 , 使 得 它们 中 断 任 一 被 阻塞 的 慢 速 系统 调用 。 当 进 程 阻 塞 在 调用 read 
函数 等 待 慢 速 设备 输入 时 ， 很 可 能 发 生 这 两 种 信号 (如 果 设 置 闹钟 以 阻止 永远 等 竺 输入， 那么 对 
于 SIGALRM 信号 ， 这 种 情况 尤其 会 发 生 )。 处 理 这 种 问题 的 代码 类 似 于 下 面 所 示 : 


if (intr_flag) /* flag set by our SIGINT handler */ 
handle_intr(); 
if (alrm_flag) /* flag set by our SIGALRM handler */ 


handle_alrm(); 
/* signals occurring in here are lost */ 
while (read( ... ) < 0) { 
if (errno == EINTR) { 
if (alrm_flag) 
handle alrm(); 
else if (intr flag) 
handle intr(); 
) else { 
/* some other error */ 
} 


) else if (n == 0) { 
/* end of file */ 
} else { 


/* process input */ 


} 

在 调用 read 之 前 测试 各 全 局 标志 ， 如 果 read 返回 一 个 中 断 的 系统 调用 错误 ， 则 再 次 进行 
测试 。 如 果 在 前 两 个 if 语句 和 后 随 的 read 调用 之 间 捕 捉 到 两 个 信号 中 的 任意 一 个 ， 则 问题 就 
发 生 了 。 正 如 代码 中 的 注释 所 指出 的 ， 在 此 处 发 生 的 信号 丢失 了 。 调 用 信号 处 理 程序 ， 它 们 设置 
了 相应 的 全 局 变量 ， 但 是 read 决 不 会 返回 (除非 某 些 数据 已 准备 好 可 读 )。 

我 们 希望 实现 下 列 操作 步 又 。 

(1) 阻塞 SIGINT 和 SIGALRM。 

(2) 测试 两 个 全 局 变量 以 判别 是 否 发 生 了 一 个 信号 ， 如 果 已 发 生 则 对 此 进行 处 理 。 

(3) 调用 read (或 任何 其 他 系统 函数 ) 并 解除 对 这 两 个 信号 的 阻塞 ， 这 两 个 操作 应 当 是 一 
个 原子 操作 。 

仅 当 第 (3) 步 是 pause 操作 时 ，sigsuspend 函数 才能 帮助 我 们 。 


10.17 PAR abort 


前 面 已 提 及 abort 函数 的 功能 是 使 程序 异常 终止。 
#include <stdlib.h> 


void abort (void); 





此 函数 不 返回 值 
此 函数 将 SIGABRT 信号 发 送 给 调用 进程 (进程 不 应 忽略 此 信号 )。ISO C 规定 ， 调 用 abort 
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将 向 主机 环境 递送 一 个 未 成 功 终止 的 通知 ， 其 方法 是 调用 rai se (SIGABRT) 函数 。 

ISO C 要 求 若 捕 提 到 此 信号 而 且 相 应 信号 处 理 程 序 返 回 ，abort 仍 不 会 返回 到 其 调用 者 。 如 
果 捕 捉 到 此 信号 ， 则 信号 处 理 程 序 不 能 返回 的 唯一 方法 是 它 调用 exit、_exit、_Exit、longjmp 
或 siglongjmp (10.15 节 讨 论 了 longjmp 和 siglongjmp 之 间 的 区 别 )。POSIX.1 也 说 明 abort 
并 不 理会 进程 对 此 信号 的 阻塞 和 和 忽略 。 

让 进程 捕捉 SIGABRT 的 意图 是 : 在 进程 终止 之 前 由 其 执行 所 需 的 清理 操作 。 如 果 进 程 并 不 
在 信号 处 理 程序 中 终止 自己 ，POSIX.1 声明 当 信 号 处 理 程序 返回 时 ，abort 终止 该 进程 。 

ISO C 针对 此 函数 的 规范 将 下 列 问题 留 由 实现 决定 : 是 否 要 冲洗 输出 流 以 及 是 否 要 删除 临时 
文件 CSL 5.13 节 )。 POSIX.1 的 要 求 则 更 进一步 ， 它 要 求 如 果 abort 调用 终止 进程 ， 则 它 对 所 
有 打开 标准 IO 流 的 效果 应 当 与 进程 终止 前 对 每 个 流 调用 fclose 相同 。 


System V 的 早期 版 本 中 ，abort 函数 产生 SIGIOT 信号 。 更 进一步 ,进程 忽略 此 信号 或 者 捕 
提 它 并 从 信号 处 理 程序 返回 ， 这 都 是 可 能 的 ， 在 返回 情况 下 ，abort 返回 到 它 的 调用 者 。 

4.3BSD 产生 SIGILL 信和 号。 在 此 之 前 ,该 函数 解除 对 此 信号 的 阻塞 ,将 其 配置 恢复 为 SIG_DFT 
(终止 并 创建 core 文件 )。 这 阻止 一 个 进程 忽略 或 捕捉 此 信和 号 。 

历史 上 ，abort 的 各 种 实现 在 如 何 处 理 标准 IO 流 方 面 是 并 不 相同 的 。 对 于 保护 性 的 程序 设 
计 以 及 为 提高 可 移植 性 ， 如 果 和 希望 冲洗 标准 VO 流 ， 则 在 调用 abort 之 前 要 执行 这 种 操作 。 在 
err dump 函数 中 实现 了 这 一 点 ( 见 附录 B )。 

因为 大 多 数 UNIX 系统 tmpfile (临时 文件 ) 的 实现 在 创建 该 文件 之 后 立即 调用 unlink, 
所 以 ISO C 关于 临时 文件 的 警告 通常 与 我 们 无 关 。 


由 实例 
图 10-25 中 的 abort 函数 是 按 POSIX.1 说 明 实 现 的 。 


#include <signal.h> 
#include <stdio.h> 

#include <stdlib.h> 
#include <unistd.h> 


void 
abort (void) /* POSIX-style abort() function */ 
{ 

sigset_t mask; 

struct sigaction action; 


/* Caller can't ignore SIGABRT, if so reset to default */ 
sigaction(SIGABRT, NULL, &action); 
if (action.sa_handler == SIG_IGN) { 
action.sa_handler = SIG_DFL; 
sigaction(SIGABRT, &action, NULL); 
} 
if (action.sa_handler == SIG_DFL) 
fflush (NULL) ; /* flush all open stdio streams */ 


/* Caller can't block SIGABRT; make sure it's unblocked */ 
sigfillset (&mask) ; 
sigdelset(&mask, SIGABRT); /* mask has only SIGABRT turned off */ 
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sigprocmask(SIG SETMASK, &mask, NULL); 
kill(getpid(), SIGABRT); /* send the signal */ 


/* If we're here, process caught SIGABRT and returned */ 


fflush (NULL); /* flush all open stdio streams */ 
action.sa handler = SIG DFL; 

sigaction(SIGABRT, &action, NULL); /* reset to default */ 
sigprocmask(SIG SETMASK, &mask, NULL); /* just in case ... */ 
kill(getpid(), SIGABRT); /* and one more time */ 
exit(1); /* this should never be executed ... */ 








图 10-25 abort 的 POSIX.1 实现 

首先 查看 是 否 将 执行 默认 动作 ， 若 是 则 冲洗 所 有 标准 VO 流 。 这 并 不 等 价 于 对 所 有 打开 的 流 
调用 fclose〔( 因 为 只 冲洗 ， 并 不 关闭 它们 )， 但 是 当 进 程 终 止 时 ， 系 统 会 关闭 所 有 打开 的 文件 。 
如 果 进 程 捕捉 此 信号 并 返回 ， 那 么 因为 进程 可 能 产生 了 更 多 的 输出 ， 所 以 再 一 次 冲洗 所 有 的 流 。 
不 进行 冲洗 处 理 的 唯一 条 件 是 如 果 进 程 捕捉 此 信号 ， 然 后 调用 _exit 或 _ Exit。 在 这 种 情况 下 ， 
任何 未 冲洗 的 内 存 中 的 标准 VO 缓存 都 被 丢弃 。 我 们 假定 捕捉 此 信和 号， 而 且 _ exit 或 Exit 的 调 
用 者 并 不 想 要 冲洗 缓冲 区 。 

回忆 10.9 节 , 如 果 调 用 kill 使 其 为 调用 者 产生 信和 号, 并且 如 果 该 信号 是 不 被 阻塞 的 (图 10-25 
中 的 程序 保证 做 到 这 一 点 )， 则 在 kill 返回 前 该 信号 〈 或 某 个 未 决 、 未 阻塞 的 信号 ) 就 被 传送 给 
了 该 进程 。 我 们 阻塞 除 SIGABRT 外 的 所 有 信号 ， 这 样 就 可 知 如 果 对 xiil 的 调用 返回 了 ， 则 该 
进程 一 定 已 捕捉 到 该 信号 ， 并 且 也 从 该 信号 处 理 程序 返回 。 E 


10.18 PA system 


8.13 节 已 经 有 了 一 个 system 函数 的 实现 ， 但 是 该 版 本 并 不 执行 任何 信号 处 理 。POSIX.1 要 
求 system 忽略 SIGINT 和 SIGOUIT， 阻 塞 SIGCHLD。 在 给 出 一 个 正确 地 处 理 这 些 信号 的 一 个 
版 本 之 前 ， 先 说 明 为 什么 要 考虑 信号 处 理 。 


s 35 
图 10-26 中 的 程序 使 用 8.13 节 中 的 system 版 本 ， 用 其 调用 ea(1) 编 辑 器 。(ed 编辑 器 很 久 


以 来 就 是 UNIX 的 组 成 部 分 。 在 这 里 使 用 它 的 原因 是 : 它 是 捕捉 中 断 和 退出 信号 的 交互 式 程序 。 
若 从 shell 调用 sd， 并 键入 中 断 字符 ， 则 它 捕捉 中 断 信 号 并 打印 问号 。eq 程序 对 退出 信号 的 处 理 


方式 设置 为 忽略 。) 
图 10-26 中 的 程序 用 于 捕捉 SIGINT 和 SIGCHLD 信号 。 若 调用 它 则 可 得 : 
$ ./a.out 
a 将 正文 追加 至 编辑 器 缓冲 区 
Here is one line of text 
. 行 首 的 点 停止 追加 方式 
1,$p 打印 缓冲 区 中 的 第 一 行 至 最 后 一 行 ， 以 便 观 察 其 内 容 
Here is one line of text 
w temp. foo 将 缓冲 区 写 至 一 文件 
25 编辑 器 称 写 了 25 个 字 节 


q 离开 编辑 器 


366 
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caught SIGCHLD 


当 编辑 器 终止 时 ， 系 统 向 父 进 程 (a .out 进程 ) 发 送 SIGCHLD 信号 。 父 进程 捕捉 它 ， 执 行 其 处 
理 程序 sig_chid， 然 后 从 信号 处 理 程 序 返 回 。 但 是 若 父 进程 正 捕捉 SIGCHLD 信号 〈 因 为 它 创 
367| 建 了 子 进程 ， 所 以 应 当 这 样 做 以 便 了 解 它 的 子 进程 在 何 时 终止 )， 那 么 正在 执行 system 函数 时 ， 
应 当 阻 塞 对 父 进程 递送 SIGCHLD 信号 。 实 际 上 ， 这 就 是 POSIX.1 所 说 明 的 。 否 则 ， 当 system fi 
建 的 子 进程 结束 时 ，system 的 调用 者 可 能 错误 地 认为 ， 它 自己 的 一 个 子 进程 结束 了 。 于 是 ， 调 
用 者 将 会 调用 一 种 wait 函数 以 获得 子 进程 的 终止 状态 ， 这 样 就 阻止 了 system 函数 获得 子 进 程 

的 终止 状态 ， 并 将 其 作为 它 的 返回 值 。 


#include "apue.h" 


static void 
sig_int(int signo) 
{ 
printf ("caught SIGINT\n"); 
} 


static void 
sig_chld(int signo) 
{ 
printf ("caught SIGCHLD\n") ; 
} 


int 


main (void) 


{ 


if (signal(SIGINT, sig_int) == SIG_ERR) 
err_sys("signal(SIGINT) error"); 
if (signal(SIGCHLD, sig_chld) == SIG_ERR) 


err_sys ("signal (SIGCHLD) error"); 
if (system("/bin/ed") < 0) 
err_sys("system() error"); 
exit (0); 








图 10-26 JH syetem 调用 ea 编辑 器 
如 果 再 次 执行 该 程序 ， 在 这 次 运行 时 将 一 个 中 断 信 号 传送 给 编辑 器 ， 则 可 得 : 


$ ./a.out 

a 将 正文 追加 至 编辑 器 缓冲 区 

hello, world 

; 行 首 的 点 停止 追加 方式 

1,$p 打印 缓冲 区 中 的 第 一 行 至 最 后 一 行 ， 以 便 观 察 其 内 容 


hello, world 
w temp.foo 将 缓冲 区 写 至 一 文件 
13 编辑 器 称 写 了 13 个 字 节 
^C 键入 中 断 符 
? 编辑 器 捕捉 信号 ， 打 印 问号 
caught SIGINT 父 进程 执行 同一 操作 
q 离开 编辑 器 
368 caught SIGCHLD 


回忆 9.6 节 可 知 ， 键 入 中 断 字 符 可 使 中 断 信号 传送 给 前 台 进程 组 中 的 所 有 进程 。 图 10-27 展示 了 编 
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辑 器 正在 运行 时 的 各 个 进程 的 关系 。 
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图 10-27 图 10-26 程序 运行 时 的 前 合 和 后 全 进程 组 
在 这 一 实例 中 ，SIGINT 被 送 给 3 个 前 台 进 程 (shell 进程 忽略 此 信和 号 )。 从 输出 中 可 见 ，a .out 
进程 和 ed 进程 捕捉 该 信号 。 但 是 ， 当 用 system 运行 另 一 个 程序 时 ， 不 应 使 父 、 子 进程 两 者 都 
捕捉 终端 产生 的 两 个 信号 : 中断 和 退出 。 这 两 个 信号 只 应 发 送 给 正在 运行 的 程序 ， 子 进程 。 因 为 
由 system 执行 的 命令 可 能 是 交互 式 命令 (如 本 例 中 的 ed)， 以 及 因为 system 的 调用 者 在 程序 
执行 时 放弃 了 控制 ， 等 待 该 执行 程序 的 结束 ， 所 以 system 的 调用 者 就 不 应 接收 这 两 个 终端 产生 
的 信号 。 这 就 是 为 什么 POSIX.1 规定 system 的 调用 者 在 等 待命 令 完成 时 应 当 忽略 这 两 个 信号 





的 原因 。 s 
s 39 
图 10-28 中 的 程序 是 system 函数 的 另 一 个 实现 ， 它 进行 了 所 要 求 的 信号 处 理 。 
#include <sys/wait.h> 
#include <errno.h> 
#include <signal.h> 


#include <unistd.h> 


int 
system(const char *cmdstring) /* with appropriate signal handling */ 
{ 
pid_t pid; 
int status; 
struct sigaction ignore, saveintr, savequit; 
sigset_t chldmask, savemask; 
if (cmdstring == NULL) 
return (1); /* always a command processor with UNIX */ 
ignore.sa_handler = SIG_IGN; /* ignore SIGINT and SIGQUIT */ 


sigemptyset (&ignore.sa_mask) ; 
ignore.sa_flags = 0; 
if (sigaction(SIGINT, &ignore, &saveintr) < 0) 
return (-1); 
if (sigaction(SIGQUIT, &ignore, &savequit) < 0) 
return (-1); 
sigemptyset (&chldmask) ; /* now block SIGCHLD */ 
sigaddset (&chldmask, SIGCHLD); 
if (sigprocmask(SIG_BLOCK, &chldmask, &savemask) < 0) 
return (-1); 


if ((pid = fork()) < 0) { 
status = -1; /* probably out of processes */ 

} else if (pid == 0) { f* Child 4y 
/* restore previous signal actions & reset signal mask */ 
sigaction(SIGINT, &saveintr, NULL); 
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sigaction(SIGQUIT, &savequit, NULL); 
sigprocmask(SIG_SETMASK, &savemask, NULL); 


execl("/bin/sh", "sh", "-c", cmdstring, (char *)0); 
_exit (127); /* exec error */ 
} else { /* parent */ 
while (waitpid(pid, &status, 0) < 0) 
if (errno != EINTR) { 
status = -1; /* error other than EINTR from waitpid() */ 


break; 


/* restore previous signal actions & reset signal mask */ 
if (sigaction(SIGINT, &saveintr, NULL) < 0) 
return (-1); 
if (sigaction(SIGQUIT, &savequit, NULL) < 0) 
return (-1); 
if (sigprocmask(SIG SETMASK, &savemask, NULL) < 0) 
return(-1); 


return(status); 


图 10-28 system 函数 的 POSIX.1 正确 实现 
如 果 将 图 10-26 中 的 程序 与 system 函数 的 这 一 实现 相 链 接 ， 那 么 所 产生 的 二 进 制 代码 与 上 
一 个 有 缺陷 的 程序 相 比 较 ， 存 在 如 下 差别 。 
a) 当 我 们 键入 中 断 字 符 或 退出 字符 时 ， 不 向 调用 进程 发 送信 号。 
(2) 当 ed 命令 终止 时 ， 不 向 调用 进程 发 送 SIGCHLD 信号 。 作 为 替代 ， 在 程序 末尾 的 
sigprocmask 调用 对 SIGCHLD 信号 解除 阻塞 之 前 ，SIGCHLD 信号 一 直 被 阻塞 。 而 对 
sigprocmask 函数 的 这 一 次 调用 是 在 system 函数 调用 waitpid 获取 子 进程 的 终止 状态 之 后 。 


POSIX.1 说 明 ， 在 SIGCHLD 未 决 期 间 ， 如 若 wait 或 waitpid 返回 了 子 进 程 的 状态 ， 那 么 
SIGCHLD 信号 不 应 递送 给 该 父 进程 ， 除 非 另 一 个 子 进程 的 状态 也 可 用 。FreeBSD 8.0, Mac OS X 
10.6.8 和 Solaris 10 都 实现 了 这 种 语义 , 而 Linux 32.0 没有 实现 这 种 语义 , 在 system 函数 调用 了 
waitpid Æ, SIGCHLD 保持 为 未 决 ; 当 解 除了 对 此 信号 的 阻塞 后 ， 它 被 递送 至 调用 者 。 如 果 我 
们 在 图 10-26 的 sig chld 函数 中 调用 wait, Linux 系统 将 返回 -1， 并 将 errno 设置 为 ECHILD, 
因为 system 函数 已 取 到 子 进 程 的 终止 状态 。 


很 多 较 早 的 书 中 使 用 下 列 程序 段 ， 它 忽略 中 断 和 退出 信和 号; 


if ( (pid = fork()) < 0){ 
err_sys("fork error"); 

}else if (pid == 0) { 
/* child */ 
execl(...): 
 exit(127); 

} 


/* parent */ 
old_intr signal (SIGINT, SIG_IGN); 
old_quit = signal(SIGQUIT, SIG_IGN); 


[ 
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waitpid(pid, &status, 0) 
signal(SIGINT, old_intr); 
signal (SIGQUIT, old quit); 


这 段 代 码 的 问题 是 : 在 fork 之 后 不 能 保证 父 进程 还 是 子 进程 先 运 行 。 如 果子 进程 先 运行 ， 
父 进程 在 一 段 时 间 后 再 运行 ， 那 么 在 父 进程 将 中 断 信号 的 处 理 更 改 为 忽略 之 前 ， 就 可 能 产生 这 种 
信和 号。 由 于 这 种 原因 ， 图 10-28 中 在 fork 之 前 就 改变 对 该 信号 的 配置 。 

注意 ,， 子 进程 在 调用 execl 之 前 要 先 恢复 这 两 个 信号 的 处 理 。 如 同 8.10 节 中 所 说 明 的 一 样 ， 
这 就 允许 在 调用 者 配置 的 基础 上 ，execl 可 将 它们 的 配置 更 改 为 默认 值 。 = 


system 的 返回 值 


注意 system 的 返回 值 ， 它 是 shell 的 终止 状态 , 但 shell 的 终止 状态 并 不 总 是 执行 命令 字符 串 进 
程 的 终止 状态 。 图 8-23 中 有 一 些 例子 ， 其 结果 正 是 我 们 所 期 望 的 。 如 果 执 行 一 条 如 date 那样 的 简 
单 命令 ， 其 终止 状态 是 0。 执行 shell 命令 exit 44， 则 得 终止 状态 44。 在 信和 号 方面 又 如 何 呢 ? 
运行 图 8-24 程序 ， 并 向 正在 执行 的 命令 发 送 一 些 信号 : 


$ tsys "sleep 30" 


^Cnormal termination, exit status = 130 键入 中 断 符 

$ tsys "sleep 30" 

“\sh: 946 Quit 键入 退出 符 

normal termination, exit status = 131 371 


当 用 中 断 信号 终止 sleep 时 , pr exit 函数 UA 8-5) 认为 它 正 常 终止 。 当 用 退出 符 杀 死 sleep 
进程 时 ， 会 发 生 同 样 的 事情 。 终 止 状态 130、131 又 是 怎样 得 到 的 呢 ? 原来 Bourne shell 有 一 个 在 
其 文档 中 没有 说 清楚 的 特性 ， 其 终止 状态 是 128 加 上 一 个 信和 号 编号 ， 该 信号 终止 了 正在 执行 的 命 
令 。 用 交互 方式 使 用 shell 可 以 看 到 这 一 点 。 





$ sh 确保 运行 Bourne shell 

$ sh -c "sleep 30" 

^c 键入 中 断 符 

$ echo $? 打印 最 后 一 条 命令 的 终止 状态 
130 


$ sh -c "sleep 30" 
^Nsh: 962 Quit - core dumped ”键入 退出 符 


$ echo $? 打印 最 后 一 条 命令 的 终止 状态 
131 
$ exit 离开 Bourne shell 


在 所 使 用 的 系统 中 ，SIGINT 的 值 为 2，SIGQUIT 的 值 为 3， 于 是 给 出 shell 终止 状态 130, 131. 
再 试 一 个 类 似 的 例子 ， 这 一 次 将 一 个 信号 直接 送 给 shell， 然 后 观察 system 返回 什么 : 


$ tsys "sleep 30" & 这 一 次 在 后 台 启 动 它 
9257 
$ ps -f 查看 进程 ID 


UID PID PPID TTY TIME CMD 
sar 9260 949 pts/5 0:00 ps -f 
sar 9258 9257 pts/5 0:00 sh -c sleep 30 
sar 949 947 pts/5 0:01 /bin/sh 
sar 9257 949 pts/5 0:00 tsys sleep 30 
sar 9259 9258 pts/5 0:00 sleep 30 
$ kill -KILL 9258 杀 死 shell 自身 
abnormal termination, signal number = 9 
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从 中 可 见 ， 仅 当 shell 本 身 异 党 终止 时 ，systenm 的 返回 值 才 报告 一 个 异常 终止 。 

其 他 的 shell 在 处 理 终端 产生 的 信号 (如 SIGINT 和 SIGQUIT ) 时 表现 出 来 的 行为 各 不 相同 。 
例如 在 bash 和 dash 中 ， 键 入 中 断 或 退出 符 会 导致 带 有 对 应 信号 编号 的 表示 异常 终止 的 退出 状态 。 
422, 如果 发 现 正在 执行 sleep 的 进程 并 直接 给 它 发 送信 号 , 这 样 信号 只 会 到 达 单 个 进程 而 不 是 

整个 前 台 进 程 组 。 这 些 shell 与 Bourne shell 类 似 ， 以 正常 终止 状态 128 加 上 信号 编号 退出 。 
在 编写 使 用 system 函数 的 程序 时 ， 一 定 要 正确 地 解释 返回 值 。 如 果 直 接 调 用 fork, exec 

Hwait, WEIRKAa aH system IAI. 
R 则 终止 状态 与 调用 是 不 同 的 


10.19 AŽ sleep, nanosleep 和 clock_nanosleep 


在 本 书 的 很 多 例子 中 都 已 使 用 了 sheep 函数 ， 在 图 10-7 程序 和 图 10-8 程序 中 有 两 个 sleep 的 
实现 ， 但 它们 都 是 有 缺陷 的 。 


#include <unistd.h> 








unsigned int sleep(unsigned int seconds) ; 





返回 值 : 0 或 未 休眠 完 的 秒 数 
此 函数 使 调用 进程 被 挂 起 直到 满足 下 面 两 个 条 件 之 一 。 
(1) 已 经 过 了 seconds 所 指定 的 墙 上 时 钟 时 间 。 
(2) 调用 进程 捕捉 到 一 个 信号 并 从 信和 号 处 理 程序 返回 。 
如 同 alarm 信号 一 样 ， 由 于 其 他 系统 活动 ， 实 际 返 回 时 间 比 所 要 求 的 会 迟 一 些 。 
在 第 1 种 情形 ， 返 回 值 是 0。 当 由 于 捕捉 到 某 个 信号 sleep 提早 返回 时 (第 2 种 情形 )， 返 
回 值 是 未 休眠 完 的 秒 数 〈( 所 要 求 的 时 间 减 去 实际 休眠 时 间 )。 
尽管 sleep 可 以 用 alarm FRA CHL 10.10 节 ) 实现 , 但 这 并 不 是 必需 的 。 如 果 使 用 alarm, 
则 这 两 个 函数 之 间 可 能 相互 影响 。POSIX.1 标准 对 这 些 相互 影响 并 未 做 任何 说 明 。 例 如 ， 若 先 调用 
alarm(10)， 过 了 3 秒 后 又 调用 sleep(3)， 那 么 将 如 何 呢 ? sleep 将 在 5 秒 后 返回 (假定 在 这 段 时 间 
内 没有 捕捉 到 另 一 个 信号 )， 但 是 否 在 2 秒 后 又 产生 另 一 个 SIGALRM 信和 号 呢 ? 此 细节 与 具体 实现 有 关 。 
FreeBSD 8.0, Linux 3.2.0, Mac OS X 10.6.8 和 Solaris 10 用 nanosleep HA FHM sleep, 
使 sleep 具体 实现 与 信号 和 闹钟 定时 器 相互 独立 。 考 虑 到 可 移植 性 ， 不 应 对 sleep 的 实现 进行 任何 
假定 ， 但 是 如 果 混 合 调用 sleep 和 其 他 与 时 间 有 关 的 函数 ， 则 需 了 解 它 们 之 间 可 能 产生 的 交互 。 


s 9l 

图 10-29 给 出 的 是 一 个 POSIX.] sleep 函数 的 实现 。 此 函数 是 图 10-7 程序 的 修改 版 ， 它 可 
靠 地 处 理 信号 ， 避 免 了 早期 实现 中 的 竞争 条 件 ， 但 是 仍 未 处 理 与 以 前 设置 的 闹钟 的 交互 作用 (下 
如 前 面 提 到 的 ，POSIX.1 并 未 显 式 地 对 这 些 交 互 进行 定义 )。 








#include "apue.h" 


static void 
sig_alrm(int signo) 
{ 


/* nothing to do, just returning wakes up sigsuspend() */ 
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unsigned int 373 
sleep(unsigned int seconds) 
{ 

struct sigaction newact, oldact; 

sigset_t newmask, oldmask, suspmask; 

unsigned int unslept; 


/* set our handler, save previous information */ 
newact.sa_handler = sig_alrm; 

sigemptyset (&newact.sa_mask) ; 

newact.sa_flags = 0; 

sigaction(SIGALRM, &newact, &oldact); 


/* block SIGALRM and save current signal mask */ 
sigemptyset (&newmask) ; 

sigaddset(&newmask, SIGALRM); 

sigprocmask(SIG BLOCK, &newmask, &oldmask); 


alarm(seconds); 
suspmask - oldmask; 


/* make sure SIGALRM isn't blocked */ 
sigdelset(&suspmask, SIGALRM); 


/* wait for any signal to be caught */ 
sigsuspend(&suspmask); 


/* some signal has been caught, SIGALRM is now blocked */ 
unslept - alarm(0); 


/* reset previous action */ 
sigaction(SIGALRM, &oldact, NULL); 


/* reset signal mask, which unblocks SIGALRM */ 
sigprocmask(SIG SETMASK, &oldmask, NULL); 
return (unslept); 


图 10-29 sleep 的 可 靠 实现 
与 图 10-7 相 比 , 为 了 可 靠 地 实现 sleep, 图 10-29 的 代码 比较 长 。 程序 中 没有 使 用 任何 形式 
的 非 局 部 转移 (如 图 10-8 中 为 了 避免 在 alarm 和 pause 之 间 的 竞争 条 件 所 做 的 那样 )， 所 以 对 
处 理 SIGALRM 信号 期 间 可 能 执行 的 其 他 信号 处 理 程 序 没 有 任何 影响 。 s 
nanosleep 函数 与 sleep 函数 类 似 ， 但 提供 了 纳 秒 级 的 精度 。 


#include <time.h> 





int nanosleep(const struct timespec *regtp, struct timespec *remip) ; 


返回 值 ; 若 休眠 到 要 求 的 时 间 ， 返 回 0， 若 出 错 ， 返 回 -1 





这 个 函数 挂 起 调用 进程 ， 直到 要 求 的 时 间 已 经 超时 或 者 某 个 信号 中 断 了 该 函数 。reqip 参数 用 
秒 和 纳 秒 指定 了 需要 休眠 的 时 间 长 度 。 如 果 某 个 信号 中 断 了 休眠 间隔 ， 进 程 并 没有 终止 ，remip 
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参数 指向 的 timespec 结构 就 会 被 设置 为 未 休眠 完 的 时 间 长 度 。 如 果 对 未 休眠 完 的 时 间 并 不 感 兴 
趣 ， 可 以 把 该 参数 置 为 NULL。 
如 果 系 统 并 不 支持 纳 秒 这 一 精度 ， 要 求 的 时 间 就 会 取 整 。 因 为 nanosleep 函数 并 不 涉及 产 
生 任 何 信号 ， 所 以 不 需要 担心 与 其 他 函数 的 交互 。 
nanosleep 函数 过 去 属于 Single UNIX Specification 的 定时 器 选项 , 现 已 被 移 至 SUSv4 的 基 
础 部 分 。 


随 着 多 个 系统 时 钟 的 引入 《回忆 6.10 节 )， 需 要 使 用 相对 于 特定 时 钟 的 延迟 时 间 来 挂 起 调用 
线程 。clock_nanosleep 函数 提供 了 这 种 功能 。 


#include <time.h> 





int clock_nanosleep(clockid_t clock_id, int flags, 


const struct timespec *reqtp, struct timespec *remtp); 
返回 值 ， 若 休眠 要 求 的 时 间 ， 返 回 0， 若 出 错 ， 返 回 错误 码 

clock_ 达 参数 指定 了 计算 延迟 时 间 基 于 的 时 钟 。 时 钟 标识 符 列 于 图 6-8 Po flags 参数 用 于 控制 延 
迟 是 相对 的 还 是 绝对 的 。flags 为 0 时 表示 休眠 时 间 是 相对 的 〈 例 如 , 希望 休眠 的 时 间 长 度 ) 如 果 flags 
值 设置 为 TIMER_ABSTIME， 表示 休眠 时 间 是 绝对 的 (例如 ,希望 休眠 到 时 钟 到 达 某 个 特定 的 时 间 )。 

其 他 的 参数 reqtp 和 remtp， 与 nanosleep 函数 中 的 相同 。 但 是 ， 使 用 绝对 时 间 时 ，remip 参数 
未 使 用 ， 因 为 没有 必要 。 在 时 钟 到 达 指 定 的 绝对 时 间 值 以 前 ， 可 以 为 其 他 的 clock_nanosleep 
调用 复 用 reqtp 参数 相同 的 值 。 

注意 ， 除 了 出 错 返回 ， 调 用 

clock_nanosleep(CLOCK_REALTIME, 0, reqtp, remtp); 
和 调用 

nanosleep(reqtp, remtp); 
的 效果 是 相同 的 。 使 用 相对 休眠 的 问题 是 有 些 应 用 对 休眠 长 度 有 精度 要 求 ， 相 对 休眠 时 间 会 导致 
实际 休眠 时 间 比 要 求 的 长 。 例 如 ， 某 个 应 用 程序 希望 按 固定 的 时 间 间 隔 执行 任务 ， 就 必须 获取 当 
前 时 间 , 计算 下 次 执行 任务 的 时 间 , 然后 调用 nanosleep。 在 获取 当前 时 间 和 调用 nanosleep 
之 间 ， 处 理 器 调度 和 抢占 可 能 会 导致 相对 休眠 时 间 超过 实际 需要 的 时 间 间 隔 。 即 便 分 时 进程 调 
度 程 序 对 休眠 时 间 结 束 后 是 否 会 马上 执行 用 户 任务 并 没有 给 出 保证 ， 使 用 绝对 时 间 还 是 改善 了 
精度 。 





在 Single UNIX Specification 的 早期 版 本 中 ，clock_nanosleep 函数 属于 时 钟 选择 选项 ,在 
SUSv4 中 ， 该 函数 已 移 至 基础 部 分 。 


10.20 AŽ sigqueue 


在 10.8 节 中 ,我们 介绍 了 大 部 分 UNIX 系统 不 对 信号 排队 。 在 POSIX.1 的 实时 扩展 中 ， 有 
些 系 统 开 始 增加 对 信和 号 排队 的 支持 。 在 SUSv4 中 ,排队 信号 功能 已 从 实时 扩展 部 分 移 至 基础 说 
明 部 分 。 

通常 一 个 信号 带 有 一 个 位 信息 : 信号 本 身 。 除 了 对 信号 排队 以 外 ， 这 些 扩展 允许 应 用 程序 在 
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递交 信号 时 传递 更 多 的 信息 (回忆 10.14 节 )。 这 些 信息 嵌入 在 siginfo 结构 中 。 除 了 系统 提供 
的 信息 ， 应 用 程序 还 可 以 向 信号 处 理 程序 传递 整数 或 者 指向 包含 更 多 信息 的 缓冲 区 指针 。 

使 用 排队 信和 号 必须 做 以 下 几 个 操作 。 

(1) 使 用 sigaction 函数 安装 信号 处 理 程序 时 指定 SA_SIGINFO 标志 。 如 果 没 有 给 出 这 个 
标志 ， 信 和 号 会 延迟 ， 但 信号 是 否 进入 队列 要 取决 于 具体 实现 。 

(2) 在 sigaction 结构 的 sa_sigaction 成 员 中 【而 不 是 通常 的 sa_handler 字段 ) 提 
供 信 号 处 理 程序 。 实 现 可 能 允许 用 户 使 用 sa_handler 字段 ， 但 不 能 获取 sigqueue 函数 发 送 
出 来 的 额外 信息 。 

(3) 使 用 sigqueue 函数 发 送信 号。 


#include <signal.h> 
int sigqueue(pid_t pid, int signo, const union sigval value) ; 
返回 值 ， 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 
sigqueue 函数 只 能 把 信号 发 送 给 单个 进程 ， 可 以 使 用 value 参数 向 信号 处 理 程序 传递 整数 
和 指针 值 ， 除 此 之 外 ，sigqueue 函数 与 kill 函数 类 似 。 
信和 号 不 能 被 无 限 排队 。 回 忆 图 2-9 和 图 2-11 中 的 SIGQUEUE_MAX 限制 。 到 达 相 应 的 限制 以 
后 ，sigqueue 就 会 失败 ， 将 errno KW EAGAIN. 
随 着 实时 信号 的 增强 ， 引 入 了 用 于 应 用 程序 的 独立 信号 集 。 这 些 信号 的 编号 在 SIGRTMIN 一 
SIGRTMAX 之 间 ， 包 括 这 两 个 限制 值 。 注 意 ， 这 些 信 号 的 默认 行为 是 终止 进程 。 
图 10-30 总 结 了 排队 信和 号 在 本 书 不 同 的 实现 中 的 行为 上 的 差异 。 
Mac OS X 10.6.8 并 不 支持 sigqueue 或 者 实时 信和 号。 在 Solaris 10 中 ，sigqueue 在 实时 库 
librets 





FreeBSD Linux Mac OS Solaris 
8.0 3.2.0 X 10.6.8 10 








支持 sigqueue 
对 在 SIGRTMIN 和 SIGRTMAX 之 外 的 信号 排队 
即使 调用 者 没 使 用 SA_SIGINFO 标志 ， 也 对 信和 号 排队 


图 10-30 ”不同 平台 上 排队 信号 的 行为 
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在 图 10-1 所 示 的 信号 中 ，POSIX.1 认为 有 以 下 6 个 与 作业 控制 有 关 。 

SIGCHLD 子 进 程 已 停止 或 终止 。 

SIGCONT ”如 果 进 程 已 停止 ， 则 使 其 继续 运行 。 

SIGSTOP 停止 信号 不 能 被 捕 提 或 忽略 )。 

SIGTSTP 交互 式 停止 信号 。 

SIGTTIN 后 台 进 程 组 成 员 读 控制 终端 。 

SIGTTOU 后 台 进 程 组 成 员 写 控制 终端 。 

ME SIGCHLD 以 外 ， 大 多 数 应 用 程序 并 不 处 理 这 些 信号 ， 交 互 式 shell 则 通常 会 处 理 这 些 信 号 
的 所 有 工作 。 当 键入 挂 起 字符 (通常 是 Ctrl+Z) 时 ，SIGTSTP 被 送 至 前 台 进 程 组 的 所 有 进程 。 当 
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我 们 通知 shell 在 前 台 或 后 台 恢 复 运 行 一 个 作业 时 ，shell 向 该 作业 中 的 所 有 进程 发 送 SIGCONT fi 
号 。 与 此 类 似 ， 如 果 向 一 个 进程 递送 了 SIGTTIN 或 SIGTTOU 信号 ， 则 根据 系统 默认 的 方式 ， 停 
止 此 进程 ， 作 业 控 制 shell 了 解 到 这 一 点 后 就 通知 我 们 。 

一 个 例外 是 管理 终端 的 进程 ， 例 如 ，vi() 编 辑 器 。 当 用 户 要 挂 起 它 时 ， 它 需要 能 了 解 到 这 一 
点 ， 这 样 就 能 将 终端 状态 恢复 到 vi 启动 时 的 情况 。 另 外 ， 当 在 前 台 恢 复 它 时 ， 它 需要 将 终端 状 
态 设置 回 它 所 希望 的 状态 ， 并 需要 重新 绘制 终端 屏幕 。 可 以 在 下 面 的 例子 中 观察 到 与 vi 类 似 的 
程序 是 如 何 处 理 这 种 情况 的 。 

在 作业 控制 信号 间 有 某 些 交互 。 当 对 一 个 进程 产生 4 种 停止 信号 (SIGTSTP、SIGSTOP、 
SIGTTIN 或 SIGTTOU) 中 的 任意 一 种 时 ， 对 该 进程 的 任 一 未 决 SIGCONT 信号 就 被 丢弃 。 与 此 
类 似 ， 当 对 一 个 进程 产生 SIGCONT 信和 号 时 ， 对 同一 进程 的 任 一 未 决 停止 信号 被 丢弃 。 

注意 ， 如 果 进 程 是 停止 的 ， 则 SIGCONT 的 默认 动作 是 继续 该 进程 ， 否 则 忽略 此 信和 号。 通常 ， 
对 该 信号 无 需 做 任何 事情 。 当 对 一 个 停止 的 进程 产生 一 个 SIGCONT 信号 时 ， 该 进程 就 继续 ， 即 
使 该 信号 是 被 阻塞 或 忽略 的 也 是 如 此 。 


下 实例 


图 10-31 中 的 程序 演示 了 当 一 个 程序 处 理 作 业 控制 时 通常 所 使 用 的 规范 代码 序列 。 该 程序 只 
是 将 其 标准 输入 复制 到 其 标准 输出 ， 而 在 信号 处 理 程序 中 以 注释 形式 给 出 了 管理 屏幕 的 程序 所 执 
行 的 典型 操作 。 


#include "apue.h" 
#define BUFFSIZE 1024 


static void 
sig_tstp(int signo) /* signal handler for SIGTSTP */ 
{ 


sigset_t mask; 


/* ... move cursor to lower left corner, reset tty mode ... */ 
/* 

* Unblock SIGTSTP, since it's blocked while we're handling it. 
a 


sigemptyset (&mask) ; 

sigaddset(&mask, SIGTSTP); 

sigprocmask(SIG UNBLOCK, &mask, NULL); 

signal(SIGTSTP, SIG DFL); /* reset disposition to default */ 
kill(getpid(), SIGTSTP); /* and send the signal to ourself */ 
/* we won't return from the kill until we're continued */ 


signal(SIGTSTP, sig tstp); /* reestablish signal handler */ 


/* ... reset tty mode, redraw screen ... */ 
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main (void) 


{ 


int n; 

char buf [BUFFSIZE] ; 

/* 

* Only catch SIGTSTP if we're running with a job-control shell. 
&/ 

if (signal(SIGTSTP, SIG IGN) -- SIG DFL) 


signal(SIGTSTP, sig tstp); 


while ((n = read(STDIN FILENO, buf, BUFFSIZE)) > 0) 
if (write(STDOUT FILENO, buf, n) !- n) 
err_sys ("write error"); 


if (n < 0) 
err_sys ("read error"); 


exit (0); 


10-31 如 何 处 理 SIGTSTP 

当 图 10-31 中 的 程序 启动 时 , 仅 当 SIGTSTP 信号 的 配置 是 SIG_DFL, 它 才 安排 捕捉 该 信号 。 
其 理由 是 : 当 此 程序 由 不 支持 作业 控制 的 shell (如 /bin/sh) 启动 时 ， 此 信和 号 的 配置 应 当 设置 为 
SIG_IGN。 实 际 上 ，shell 并 不 显 式 地 忽略 此 信号 ， 而 是 由 init 将 这 3 个 作业 控制 信号 SIGTSTP. 
SIGTTIN 和 SIGTTOU 设置 为 SIG_IGN。 然 后 ， 这 种 配置 由 所 有 登录 shell 继承 。 只 有 作业 控制 
shell 才 应 将 这 3 个 信号 重新 设置 为 SIG_DFL。 

当 键入 挂 起 字符 时 ， 进 程 接 到 SIGTSTP 信和 号， 然后 调用 该 信号 处 理 程 序 。 此 时 ， 应 当 进 行 
与 终端 有 关 的 处 理 : 将 光标 移 到 左下 角 、 恢 复 终端 工作 方式 等 。 在 将 SIGTSTP 重 置 为 默认 值 dF 
止 该 进程 )， 并 且 解 除了 对 此 信和 号 的 阻塞 之 后 ， 进 程 向 自己 发 送 同 一 信号 SIGTSTP。 因 为 正在 处 
理 SIGTSTP 信号 ， 而 在 捕捉 该 信号 期 间 系统 自动 地 阻塞 它 ， 所 以 应 当 解 除 对 此 信号 的 阻塞 。 到 
达 这 一 点 时 , 系统 停止 该 进程 . 仅 当 某 个 进程 (通常 是 正 响 应 一 个 交互 式 fg 命令 的 作业 控制 shell) 
向 该 进程 发 送 一 个 SIGCONT 信号 时 ， 该 进程 才 继续 。 我 们 不 捕捉 STIGCONT 信号 。 该 信号 的 默 
认 配 置 是 继续 运行 停止 的 进程 ， 当 此 发 生 时 ， 此 程序 如 同 从 kill 函数 返回 一 样 继续 运行 。 当 
此 程序 继续 运行 时 , 将 SIGTSTP 信和 号 重 置 为 捕捉， 并 且 做 我 们 所 希望 做 的 终端 处 理 〔 如 重新 绘 
制 屏 幕 )。 a 
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本 节 介 绍 如 何在 信号 编号 和 信号 名 之 间 进 行 映射 。 某 些 系统 提供 数组 
extern char *sys_siglist[]; 
数组 下 标 是 信号 编号 ， 数 组 中 的 元 素 是 指向 信号 名 符 串 的 指针 。 
FreeBSD 8.0、Linux 3.2.0 和 Mac OS X 10.6.8 都 提供 这 种 信号 名 数组 。Solaris 10 也 提供 信号 
名 数组 ， 但 该 数组 名 是 sys siglist, 


可 以 使 用 psignal 函数 可 移植 地 打印 与 信号 编号 对 应 的 字符 串 。 
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#include <signal.h> 





void psignal(int signo, const char *msg); 
TIFE msg (通常 是 程序 名 ) 输出 到 标准 错误 文件 ， 后 面 跟随 一 个 冒号 和 一 个 空格 ， 再 后 面 
对 该 信号 的 说 明 ， 最 后 是 一 个 换行 符 。 如 果 msg 为 NULL， 只 有 信和 号 说 明 部 分 输出 到 标准 错误 文 
件 ， 该 函数 类 似 于 perror (1.7 节 )。 
如 果 在 sigaction 信号 处 理 程序 中 有 siginfo 结构 ， 可 以 使 用 psiginfo 函数 打印 信号 


#include <signal.h> 





void psiginfo(const siginfo t *imfo, const char *msg); 

它 的 工作 方式 与 psignal 函数 类 似 。 虽 然 这 个 函数 访问 除 信和 号 编号 以 外 的 更 多 信息 ， 但 不 
同 的 平台 输出 的 这 些 额外 信息 可 能 有 所 不 同 。 

如 果 只 需要 信和 号 的 字符 描述 部 分 ， 也 不 需要 把 它 写 到 标准 错误 文件 中 《〈 如 可 以 写 到 日 志文 件 
中 )， 可 以 使 用 strsignal 函数 ， 它 类 似 于 strerror CÓ 1.7 节 )。 











#include <string.h> 
char *strsignal(int signo); 
返回 值 ， 指 向 描述 该 信号 的 字符 串 的 指针 
给 出 一 个 信号 编号 ，strsignal 将 返回 描述 该 信号 的 字符 串 。 应 用 程序 可 用 该 字符 串 打印 
关于 接收 到 信号 的 出 错 消息 。 
本 书 讨论 的 所 有 平台 都 提供 psignal 和 strsignal 函数 ， 但 相互 之 间 有 些 差别 。 在 Solaris 
10 中 ， 若 信号 编号 无 效 ，strsignal 将 返回 一 个 空 指针 , 而 FreeBSD 8.0, Linux 3.2.0 和 Mac OS 
X 10.6.8 则 返回 一 个 字符 串 ， 它 指出 信号 编号 是 不 可 识别 的 。 
Af Linux 3.2.0 和 Solaris 10 支持 psiginfo 函数 。 


Solaris 提供 一 对 函数 ， 一 个 函数 将 信号 编号 映射 为 信号 名 ， 男 一 个 则 反之 。 


#include <signal.h> 








int sig2str(int signo, char *str); 


int str2sig(const char *str, int *signop); 





两 个 函数 的 返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 


在 编写 交互 式 程序 ， 其 中 需 接收 和 打印 信号 名 和 信和 号 编号 时 ， 这 两 个 函数 是 有 用 的 。 

sig2str 函数 将 给 定 信号 编号 翻译 成 字符 串 , 并 将 结果 存放 在 str 指向 的 存储 区 。 调 用 
者 必须 保证 该 存储 区 足够 大 ， 可 以 保存 最 长 字符 串 ， 包 括 终 止 null 字 节 。Solaris 在 
<signal.h> 中 包含 了 常量 SIG2STR_MAX， 它 定义 了 最 大 字符 串 长 度 。 该 字符 串 包括 不 带 
“SIG” 前 级 的 信号 名 。 例 如 ，sSIGKILL 被 翻译 为 字符 串 “KILL”， 并 存放 在 str 指向 的 存储 
缓冲 区 中 。 

str2sig 函数 将 给 出 的 信号 名 翻译 成 信号 编号 。 该 信号 编号 存放 在 signop 指向 的 整 型 中 。 
名 字 要 么 是 不 带 “SIG” 前 绥 的 信号 名 ， 要 么 是 表示 十 进 制 信号 编号 的 字符 串 〈 如 “9”)。 

注意 ，sig2str 和 str2sig 与 常用 的 函数 做 法 不 同 ， 当 它们 失败 时 ， 并 不 设置 errno. 
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10.23 小 结 


信号 用 于 大 多 数 复杂 的 应 用 程序 中 。 理 解 进行 信号 处 理 的 原因 和 方式 对 于 高 级 UNIX 编程 极 
其 重要 。 本 章 对 UNIX 信号 进行 了 详细 而 且 比 较 深入 的 介绍 。 首 先 说 明了 早期 信号 实现 的 问题 以 
及 它们 是 如 何 显现 出 来 的 。 然 后 介绍 了 POSIX.1 的 可 靠 信 号 概念 以 及 所 有 相关 的 函数 。 在 此 基础 
上 提供 了 abort. system 和 sleep 函数 的 POSIX.1 实现 。 最 后 以 观察 分 析 作 业 控 制 信 号 以 及 
信号 名 和 信号 编号 之 间 的 转换 结束 。 


习题 


10.1 删除 图 10-2 程序 中 的 for (; ; ) 语句 ， 结 果 会 怎样 ? 为 什么 ? 

10.2 实现 10.22 节 中 说 明 的 sig2str 函数 。 

10.3 画 出 运行 图 10-9 程序 时 的 栈 帧 情况 。 

10.4 图 10-11 程序 中 利用 setjmp 和 longjmp 设置 IO 操作 的 超时 ， 下 面 的 代码 也 常见 用 于 此 
种 目的 : 


signal (SIGALRM, sig_alrm); 

alarm(60); 

if (setjmp(env_alrm) != 0) { 
/* handle timeout */ 


} 


这 段 代 码 有 什么 错误 ? 

10.5 仅 使 用 一 个 定时 器 (alarm 或 较 高 精度 的 setitimer)， 构 造 一 组 函数 ， 使 得 进程 在 该 单 
一 定时 器 基础 上 可 以 设置 任 一 数量 的 定时 器 。 

10.6 编写 一 段 程序 测试 图 10-24 中 父 进程 和 子 进程 的 同步 函数 ， 要 求 进程 创建 一 个 文件 并 向 
文件 写 一 个 整数 0， 然 后 ， 进 程 调用 fork， 接 着 ， 父 进程 和 子 进程 交替 增加 文件 中 的 计 
数 器 值 ， 每 次 计数 器 值 增 加 1 时 ， 打 印 是 哪 一 个 进程 〈 子 进程 或 父 进 程 ) 进行 了 该 增加 
1 操作 。 

10.7 在 图 10-25 中 ， 若 调用 者 捕捉 了 SIGABRT 并 从 该 信号 处 理 程序 中 返回 ， 为 什么 不 是 仅仅 调 
用 _exit， 而 要 恢复 其 默认 设置 并 再 次 调用 kill? 

10.8 为 什么 在 siginfo 结构 CJ 10.14 45) 的 si_uid 字段 中 包括 实际 用 户 ID 而 非 有 效用 


FID? 
10.9 重 写 图 10-14 中 的 函数 ， 要 求 它 处 理 图 10-1 中 的 所 有 信号， 每 次 循环 处 理 当 前 信号 屏蔽 字 
中 的 一 个 信号 (并 不 是 对 每 一 个 可 能 的 信号 都 循环 一 次 )。 381 


10.10 编写 一 段 程序 ， 要 求 在 一 个 无 限 循 环 中 调用 sleep (60) 函数 ， 每 5 分 钟 ( 即 5 次 循环 ) 
取 当 前 的 日 期 和 时 间 ， 并 打印 tm_sec 字段 。 将 程序 执行 一 晚上 ， 请 解释 其 结果 。 有 些 程 
序 ， 如 cron 守护 进程 ， 每 分 钟 运行 一 次 ， 它 是 如 何 处 理 这 类 工作 的 ? 

10.11 修改 图 3-5 的 程序 ， 要 求 : (a) 将 BUFFSIZE 改 为 100; (b) 用 signal intr 函数 捕 
4t SIGXFSZ 信和 号 量 并 打印 消息 ， 然 后 从 信和 号 处 理 程序 中 返回 ; Coo 如 果 没 有 写 满 请 求 
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的 字 节 数 ， 则 打印 write 的 返回 值 。 将 软 资源 限制 RLIMIT FSIZE (Jh 7.11 节 ) 更 改 为 
1024 字 节 (在 shell 中 设置 软 资源 限制 ， 如 果 不 行 就 直接 在 程序 中 调用 setrlimito, 4^ 
后 复制 一 个 大 于 1024 字 节 的 文件 , 在 各 种 不 同 的 系统 上 运行 新 程序 , 其 结果 如 何 ? 为 什么 ? 
10.12 编写 一 段 调用 fwrite 的 程序 ， 它 使 用 一 个 较 大 的 缓冲 区 〈 约 1GB)， 调 用 fwrite 前 调 
用 alarm 使 得 1s 以 后 产生 信和 号。 在 信号 处 理 程序 中 打印 捕捉 到 的 信号 , 然后 返回 。 fwrite 
可 以 完成 吗 ? 结果 如 何 ? 
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11.1 引言 


在 前 面 的 章节 中 讨论 了 进程 ， 学 习 了 UNIX 进程 的 环境 、 进 程 间 的 关系 以 及 控制 进程 的 不 同 
方式 。 可 以 看 到 在 相关 的 进程 间 可 以 存在 一 定 的 共享 。 

本 章 将 进一步 深入 理解 进程 ， 了 解 如 何 使 用 多 个 控制 线程 (或 者 简单 地 说 就 是 线程 ) 在 单 进 
程 环 境 中 执行 多 个 任务 。 一 个 进程 中 的 所 有 线程 都 可 以 访问 该 进程 的 组 成 部 件 ， 如 文件 描述 符 和 
内 存 。 

不 管 在 什么 情况 下 ， 只 要 单个 资源 需要 在 多 个 用 户 间 共享 ， 就 必须 处 理 一 致 性 问题 。 本 章 的 
最 后 将 讨论 目前 可 用 的 同步 机 制 ， 防 止 多 个 线程 在 共享 资源 时 出 现 不 一 致 的 问题 。 


11.2 ”线程 概念 


典型 的 UNIX 进程 可 以 看 成 只 有 一 个 控制 线程 : 一 个 进程 在 某 一 时 刻 只 能 做 一 件 事 情 。 有 了 
多 个 控制 线程 以 后 ， 在 程序 设计 时 就 可 以 把 进程 设计 成 在 某 一 时 刻 能 够 做 不 止 一 件 事 ， 每 个 线程 
处 理 各 自 独立 的 任务 。 这 种 方法 有 很 多 好 处 。 

。 通过 为 每 种 事件 类 型 分 配 单独 的 处 理 线程 ， 可 以 简化 处 理 异 步 事 件 的 代码 。 每 个 线 
程 在 进行 事件 处 理 时 可 以 采用 同步 编程 模式 ， 同 步 编程 模式 要 比 异步 编程 模式 简单 
得 多 。 

。 多 个 进程 必须 使 用 操作 系统 提供 的 复杂 机 制 才 能 实现 内 存 和 文件 描述 符 的 共享 ， 我 们 将 
在 第 15 章 和 第 17 章 中 学 习 这 方面 的 内 容 。 而 多 个 线程 自动 地 可 以 访问 相同 的 存储 地 址 
空间 和 文件 描述 符 。 

。 有 些 问题 可 以 分 解 从 而 提高 整个 程序 的 吞吐 量 。 在 只 有 一 个 控制 线程 的 情况 下 ， 一 个 单 
线程 进程 要 完成 多 个 任务 ， 只 需要 把 这 些 任务 串 行 化 。 但 有 多 个 控制 线程 时 ， 相 互 独立 
的 任务 的 处 理 就 可 以 交叉 进行 ， 此 时 只 需要 为 每 个 任务 分 配 一 个 单独 的 线程 。 当 然 只 有 
在 两 个 任务 的 处 理 过 程 互 不 依赖 的 情况 下 ， 两 个 任务 才 可 以 交叉 执行 。 

。 交互 的 程序 同样 可 以 通过 使 用 多 线程 来 改善 响应 时 间 ， 多 线程 可 以 把 程序 中 处 理 用 户 输 
入 输出 的 部 分 与 其 他 部 分 分 开 。 

有 些 人 把 多 线程 的 程序 设计 与 多 处 理 器 或 多 核 系统 联系 起 来 。 但 是 即使 程序 运行 在 单 处 理 器 

上 ， 也 能 得 到 多 线程 编程 模型 的 好 处 。 处 理 器 的 数量 并 不 影响 程序 结构 ， 所 以 不 管 处 理 器 的 个 数 
多 少 ， 程 序 都 可 以 通过 使 用 线程 得 以 简化 。 而 且 ， 即 使 多 线程 程序 在 串 行 化 任务 时 不 得 不 阻塞 ， 
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由 于 某 些 线程 在 阻塞 的 时 候 还 有 另外 一 些 线程 可 以 运行 ， 所 以 多 线程 程序 在 单 处 理 器 上 运行 还 是 
可 以 改善 响应 时 间 和 吞吐 量 。 

每 个 线程 都 包含 有 表示 执行 环境 所 必需 的 信息 ， 其 中 包括 进程 中 标识 线程 的 线程 ID、 一 组 寄 
存 器 值 、 栈 、 调 度 优先 级 和 策略 、 信 号 屏蔽 字 、errno BH ( 见 1.7 节 ) 以 及 线程 私有 数据 ( 见 
12.6 节 )。 一 个 进程 的 所 有 信息 对 该 进程 的 所 有 线程 都 是 共享 的 ， 包 括 可 执行 程序 的 代码 、 程 序 
的 全 局 内 存 和 堆 内 存 、 栈 以 及 文件 描述 符 。 

我 们 将 要 讨论 的 线程 接口 来 自 POSIX.1-2001。 线程 接口 也 称 为 “pthread” 或 “POSIX 线程 ”， 
原来 在 POSIX.1-2001 中 是 一 个 可 选 功能 ， 但 后 来 SUSv4 把 它们 放 入 了 基本 功能 。POSIX 线程 的 
功能 测试 宏 是 _POSIX_THREADS。 应 用 程序 可 以 把 这 个 宏 用 于 #ifdef 测试 ， 从 而 在 编译 时 确定 
是 否 支 持 线程 ; 也 可 以 把 sc THREADS 常数 用 于 调用 sysconf 函数 ,进而 在 运行 时 确定 是 否 支 
持 线程 。 遵 循 SUSv4 的 系统 定义 符号 _POSIX_THREADS 的 值 为 200809L. 


11.3 ”线程 标识 


就 像 每 个 进程 有 一 个 进程 ID 一 样 , 每 个 线程 也 有 一 个 线程 ID。 进程 ID 在 整个 系统 中 是 唯一 
的 ， 但 线程 ID 不 同 ， 线 程 ID 只 有 在 它 所 属 的 进程 上 下 文中 才 有 意义 。 

回忆 一 下 进程 ID, 它 是 用 pia t 数据 类 型 来 表示 的 ， 是 一 个 非 负 整数 。 RFE ID JE pthread t 
数据 类 型 来 表示 的 ， 实 现 的 时 候 可 以 用 一 个 结构 来 代表 pthread t 数据 类 型 ， 所 以 可 移植 的 操作 
系统 实现 不 能 把 它 作为 整数 处 理 。 因 此 必须 使 用 一 个 函数 来 对 两 个 线程 ID 进行 比较 。 


#include <pthread.h> 





int pthread equal(pthread t tid], pthread t tid2); 





返回 值 ， 若 相等 ， 返 回 非 0 SA: 否则， 返回 0 


Linux 3.2.0 使 用 无 符号 长 整 型 表示 pthread 七 数据 类 型 。Solaris 10 把 pthread 七 数据 类 
型 表示 为 无 符号 整 型 。FreeBSD 8.0 和 Mac OS X 10.6.8 用 一 个 指向 pthread 结构 的 指针 来 表示 
pthread 七 数据 类 型 。 
用 结构 表示 pthread t 数据 类 型 的 后 果 是 不 能 用 一 种 可 移植 的 方式 打印 该 数据 类 型 的 值 。 
在 程序 调试 过 程 中 打印 线程 ID 有 时 是 非常 有 用 的 ， 而 在 其 他 情况 下 通常 不 需要 打印 线程 ID fe 
坏 的 情况 是 ， 有 可 能 出 现 不 可 移植 的 调试 代码 ， 当 然 这 也 算 不 上 是 很 大 的 局 限 性 。 
线程 可 以 通过 调用 pthread_self 函数 获得 自身 的 线程 ID。 


#include <pthread.h> 





pthread_t pthread_self (void); 
返回 值 : 调用 线程 的 线程 ID 


当 线 程 需要 识别 以 线程 ID 作为 标识 的 数据 结构 时 ，Pthread_self 函数 可 以 与 pthread_ 
equal 函数 一 起 使 用 。 例 如 ， 主 线程 可 能 把 工作 任务 放 在 一 个 队列 中 ， 用 线程 ID 来 控制 每 个 工 
作 线程 处 理 哪 些 作 业 。 如 图 11-1 所 示 ， 主 线程 把 新 的 作业 放 到 一 个 工作 队列 中 ,由 3 个 工作 线程 
组 成 的 线程 池 从 队列 中 移出 作业 。 主 线程 不 允许 每 个 线程 任意 处 理 从 队列 顶端 取出 的 作业 ， 而 是 
由 主线 程控 制作 业 的 分 配 ， 主 线程 会 在 每 个 待 处 理 作 业 的 结构 中 放置 处 理 该 作业 的 线程 D, 每 个 
工作 线程 只 能 移出 标 有 自己 线程 ID 的 作业 。 
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图 11-1 工作 队列 实例 


11.4 ”线程 创建 


在 传统 UNIX 进程 模型 中 ， 每 个 进程 只 有 一 个 控制 线程 。 从 概念 上 讲 ， 这 与 基于 线程 的 模型 
中 每 个 进程 只 包含 一 个 线程 是 相同 的 。 在 POSIX 线程 (pthread) 的 情况 下 ,程序 开始 运行 时 ， 它 
也 是 以 单 进程 中 的 单个 控制 线程 启动 的 。 在 创建 多 个 控制 线程 以 前 ， 程 序 的 行为 与 传统 的 进程 并 
没有 什么 区 别 。 新 增 的 线程 可 以 通过 调用 pthread_create 函数 创建 。 








#include <pthread.h> 


int pthread_create(pthread_t *restrict fidp, 
const pthread_attr_t *restrict attr, 
void * (*start_rin) (void *), void *restrict arg); 


返回 值 : 着 成 功 ， 返 回 0;， 耕 则 ， 返 回 错误 编号 


当 pthread create 成 功 返 回 时 ， 新 创建 线程 的 线程 ID 会 被 设置 成 tidp 指向 的 内 存单 元 。 
attr 参数 用 于 定制 各 种 不 同 的 线程 属性 。 我 们 将 在 12.3 节 中 讨论 线程 属性 ， 但 现在 我 们 把 它 置 为 
NULL， 创 建 一 个 具有 默认 属性 的 线程 。 

新 创建 的 线程 从 start_rin 函数 的 地 址 开始 运行 ， 该 函数 只 有 一 个 无 类 型 指针 参数 arg。 如 果 
需要 向 start_rtn 函数 传递 的 参数 有 一 个 以 上 ， 那 么 需要 把 这 些 参数 放 到 一 个 结构 中 ， 然 后 把 这 个 
结构 的 地 址 作为 arg 参数 传 入 。 

线程 创建 时 并 不 能 保证 哪个 线程 会 先 运 行 : 是 新 创建 的 线程 ， 还 是 调用 线程 。 新 创建 的 线程 
可 以 访问 进程 的 地 址 空间 ， 并 且 继 承 调 用 线程 的 浮 点 环境 和 信和 号 屏蔽 字 ， 但 是 该 线程 的 挂 起 信和 号 
集会 被 清除 。 

注意 ，pthread 函数 在 调用 失败 时 通常 会 返回 错误 码 ， 它 们 并 不 像 其 他 的 POSIX 函数 一 样 设 
置 errno。 每 个 线程 都 提供 errno 的 副本 ， 这 只 是 为 了 与 使 用 errno 的 现 有 函数 兼容 。 在 线程 
中 ， 从 函数 中 返回 错误 码 更 为 清晰 整洁 ， 不 需要 依赖 那些 随 着 函数 执行 不 断 变化 的 全 局 状态 ， 这 
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样 可 以 把 错误 的 范围 限制 在 引起 出 错 的 函数 中 。 
下 实例 

386 虽然 没有 可 移植 的 打印 线程 ID 的 方法 ， 但 是 可 以 写 一 个 小 的 测试 程序 来 完成 这 个 任务 ， 以 
便 更 深入 地 了 解 线程 是 如 何 工作 的 。 图 11-2 中 的 程序 创建 了 一 个 线程 ， 打 印 了 进程 ID、 新 线程 
的 线程 ID 以 及 初始 线程 的 线程 ID。 


#include "apue .hn 
#include <pthread.h> 


pthread_t ntid; 


void 
printids(const char *s) 
{ 
pid t pid; 
pthread t tid; 


pid = getpid(); 
tid = pthread self(); 
printf("$s pid $1lu tid $1u (0x%1x)\n", s, (unsigned long)pid, 
(unsigned long)tid, (unsigned long)tid); 
) 


void * 

thr fn(void *arg) 

{ 
printids("new thread: "); 
return((void *)0); 


int 
main (void) 


err = pthread_create(&ntid, NULL, thr_fn, NULL); 
if (err != 0) 

err_exit(err, "can't create thread"); 
printids("main thread:"); 
sleep (1); 
exit (0); 


图 11-2 ”打印 线程 ID 
这 个 实例 有 两 个 特别 之 处 ， 需 要 处 理 主线 程 和 新 线程 之 间 的 竞争 。( 我 们 将 在 这 章 后 面 的 内 
容 中 学 习 如 何 更 好 地 处 理 这 种 竞争 。) 第 一 个 特别 之 处 在 于 ， 主 线程 需要 休眠 ， 如 果 主 线程 不 休 
眠 ， 它 就 可 能 会 退出 ， 这 样 新 线程 还 没有 机 会 运行 ， 整 个 进程 可 能 就 已 经 终止 了 。 这 种 行为 特征 
依赖 于 操作 系统 中 的 线程 实现 和 调度 算法 。 
第 二 个 特别 之 处 在 于 新 线程 是 通过 调用 pthread_self 函数 获取 自己 的 线程 ID 的 ， 而 不 是 
从 共享 内 存 中 读 出 的 ， 或 者 从 线程 的 启动 例 程 中 以 参数 的 形式 接收 到 的 。 回 忆 pthread_create 
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函数 ， 它 会 通过 第 一 个 参数 (fidp) 返回 新 建 线程 的 线程 ID。 在 这 个 例子 中 ， 主 线程 把 新 线程 ID 
存放 在 ntid 中 ， 但 是 新 建 的 线程 并 不 能 安全 地 使 用 它 ， 如 果 新 线程 在 主线 程 调用 
pthread create 返回 之 前 就 运行 了 , 那么 新 线程 看 到 的 是 未 经 初始 化 的 ntia 的 内 容 , 这 个 内 
容 并 不 是 正确 的 线程 ID。 

在 Solaris 上 运行 图 11-2 中 的 程序 ， 得 到 : 

$ ./a.out 


main thread: pid 20075 tid 1 (0x1) 
new thread: pid 20075 tid 2 (0x2) 


正如 我 们 期 望 的 ， 两 个 线程 的 进程 ID 相同 ， 但 线程 ID 不 同 。 在 FreeBSD 上 运行 图 11-2 中 的 程 
FP, 得 到 : 
$ ./a.out 


main thread: pid 37396 tid 673190208 (0x28201140) 
new thread: pid 37396 tid 673280320 (0x28217140) 


也 如 我 们 期 望 的 ， 两 个 线程 有 相同 的 进程 ID 。 如 果 把 线程 ID 看 成 是 十 进 制 整数 ， 那 么 这 两 个 值 
看 起 来 很 奇怪 , 但 是 如 果 把 它们 转化 成 十 六 进 制 , 看 起 来 就 更 合理 了 。 就 像 前 面 提 到 的 , FreeBSD 
使 用 指向 线程 数据 结构 的 指针 作为 它 的 线程 ID。 

我 们 期 望 Mac OS X 与 FreeBSD 相似 , 但 事实 上 , 在 Mac OS X +H, 主线 程 ID 与 用 pthread_ 
create 新 创建 的 线程 的 线程 ID 不 在 相同 的 地 址 范围 内 : 


$ ./a.out 
main thread: pid 31807 tid 140735073889440 (0x7fff70162ca0) 
new thread: pid 31807 tid 4295716864 (0x1000b7000) 


相同 的 程序 在 Linux 上 运行 得 到 : 


$ ./a.out 
main thread: pid 17874 tid 140693894424320 (0x7ff5d9996700) 
new thread: pid 17874 tid 140693886129920 (0x7ff5d91ad700) 


尽管 Linux 线程 ID 是 用 无 符号 长 整 型 来 表示 的 ， 但 是 它们 看 起 来 像 指 针 。 


Linux 2.4 fe Linux 2.6 在 线程 实现 上 是 不 同 的 。Linux 2.4 中 , LinuxThreads 是 用 单独 的 进程 实 
现 每 个 线程 的 ， 这 使 得 它 很 难 与 POSIX 线程 的 行为 匹配 。Linux 2.6 中 ,对 Linux 内 核 和 线程 库 进 
行 了 很 大 的 修改 ， 采 用 了 一 个 称 为 Native POSIX 线程 库 ( Native POSIX Thread Library, NPTL ) 
的 新 线程 实现 。 它 支持 单个 进程 中 有 多 个 线程 的 模型 ， 也 更 容易 支持 POSIX 线程 的 语义 。 8 


11.5 ”线程 终止 


如 果 进 程 中 的 任意 线程 调用 了 exit. Exit 或 者 exit， 那 么 整个 进程 就 会 终止 。 与 此 相 
类 似 ， 如 果 上 默认 的 动作 是 终止 进程 ， 那 么 ， 发 送 到 线程 的 信号 就 会 终止 整个 进程 (12.8 节 将 讨论 
信号 与 线程 间 是 如 何 交 互 的 )。 

单个 线程 可 以 通过 3 种 方式 退出 ， 因 此 可 以 在 不 终止 整个 进程 的 情况 下 ， 停 止 它 的 控制 流 。 

C1) 线程 可 以 简单 地 从 启动 例 程 中 返回 ， 返 回 值 是 线程 的 退出 码 。 

(2) 线程 可 以 被 同一 进程 中 的 其 他 线程 取消 。 

(3) 线程 调用 pthread_exit. 
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#include <pthread.h> 
void pthread exit (void *rval ptr); 

rval_ptr 参数 是 一 个 无 类 型 指针 ， 与 传 给 启动 例 程 的 单个 参数 类 似 。 进 程 中 的 其 他 线程 也 可 
以 通过 调用 pthread_join 函数 访问 到 这 个 指针 。 


#include <pthread.h> 








int pthread_join(pthread_t thread, void **rval_ptr) ; 





返回 值 : 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


调用 线程 将 一 直 阻 塞 , 直到 指定 的 线程 调用 pthread_exit、 从 启动 例 程 中 返回 或 者 被 取消 。 
如 果 线 程 简单 地 从 它 的 启动 例 程 返回 ，rval_ptr 就 包含 返回 码 。 如 果 线 程 被 取消 ， 由 rval_ptr 指定 
的 内 存单 元 就 设置 为 PTHREAD_CANCELED. 

可 以 通过 调用 pthread_join 自动 把 线程 置 于 分 离 状态 (马上 就 会 讨论 到 )， 这 样 资源 就 可 
以 恢复 。 如 果 线 程 已 经 处 于 分 离 状 态 ，pthread_join 调用 就 会 失败 ， 返 回 EINVAL， 尽 管 这 种 
行为 是 与 具体 实现 相关 的 。 

如 果 对 线程 的 返回 值 并 不 感 兴趣 ， 那 么 可 以 把 rval ptr 设置 为 NULL。 在 这 种 情况 下 ， 调 用 
pthread join 函数 可 以 等 待 指定 的 线程 终止 ， 但 并 不 获取 线程 的 终止 状态 。 


"EA! 
图 11-3 展示 了 如 何 获取 已 终止 的 线程 的 退出 码 。 


#include "apue.h" 
#include <pthread.h> 





void * 

thr fnl(void *arg) 

{ 
printf ("thread 1 returning\n"); 
return((void *)1); 


} 


void * 

thr_fn2(void *arg) 

{ 
printf ("thread 2 exiting\n"); 
pthread_exit((void *)2); 

} 


int 
main (void) 
{ 


int err; 
pthread_t tidl, tid2; 
void *tret; 


err - pthread create(&tidl, NULL, thr fnl, NULL); 
if (err != 0) 

err exit(err, "can't create thread 1"); 
err = pthread create(&tid2, NULL, thr fn2, NULL); 
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if (err != 0) 

err exit(err, "can't create thread 2"); 
err = pthread join(tidl, &tret); 
if (err != 0) 

err exit(err, "can't join with thread 1"); 
printf("thread 1 exit code %ld\n", (long)tret); 
err - pthread join(tid2, &tret); 
if (err != 0) 

err exit(err, "can't join with thread 2"); 
printf("thread 2 exit code %ld\n", (long)tret); 
exit(0); 


图 11-3 ”获得 线程 退出 状态 
运行 图 11-3 中 的 程序 ， 得 到 的 结果 是 : 


$ ./a.out 

thread 1 returning 
thread 2 exiting 
thread 1 exit code 1 
thread 2 exit code 2 


可 以 看 到 ， 当 一 个 线程 通过 调用 pthread exit 退出 或 者 简单 地 从 启动 例 程 中 返回 时 ， 进 程 中 的 
其 他 线程 可 以 通过 调用 pthread_join 函数 获得 该 线程 的 退出 状态 。 E 


pthread create fil pthread exit 函数 的 无 类 型 指针 参数 可 以 传递 的 值 不 止 一 个 , 这 个 
指针 可 以 传递 包含 复杂 信息 的 结构 的 地 址 ， 但 是 注意 ， 这 个 结构 所 使 用 的 内 存在 调用 者 完成 调用 
以 后 必须 仍然 是 有 效 的。 例如 ， 在 调用 线程 的 栈 上 分 配 了 该 结构 ， 那 么 其 他 的 线程 在 使 用 这 个 结 
构 时 内 存 内 容 可 能 已 经 改变 了 。 又 如 ， 线 程 在 自己 的 栈 上 分 配 了 一 个 结构 ， 然 后 把 指向 这 个 结构 
的 指针 传 给 pthread_exit， 那 么 调用 pthread_ join 的 线程 试图 使 用 该 结构 时 ， 这 个 栈 有 可 
能 已 经 被 撤销 ， 这 块 内 存 也 已 另 作 他 用 。 390 


"m SP 
图 11-4 中 的 程序 给 出 了 用 自动 变量 〈 分 配 在 栈 上 ) EX pthread exit 的 参数 时 出 现 的 问题 。 


#include "apue.h" 
#include <pthread.h> 


struct foo { 
ant a; Bb, 6, dz 


hi 


void 
printfoo(const char *s, const struct foo *fp) 
{ 
printf("$s", s); 
printf(" structure at 0x%lx\n", (unsigned long) fp); 
printf(" foo.a = %d\n", fp->a); 
printf(" foo.b = d\n", fp->b); 
printf(" foo.c = %d\n", fp->c); 
.d 


printf(" foo = d\n", fp->d); 
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void * 
thr fnl(void *arg) 
{ 
struct foo foo = [1, 2, 3, 4); 


printfoo("thread 1:\n", &foo); 
pthread exit((void *)&foo); 


void * 

thr fn2(void *arg) 

{ 
printf("thread 2: ID is %lu\n", (unsigned long) pthread_self()); 
pthread exit((void *)0); 


int 
main (void) 
{ 


int err; 
pthread_t tidl, tid2; 
struct foo *fp; 


err - pthread create(&tidl, NULL, thr fnl, NULL); 
if (err != 0) 

err exit(err, "can't create thread 1"); 
err = pthread join(tidl, (void *)&fp); 


if (err != 0) 
err exit(err, "can't join with thread 1"); 
39] sleep(1); 


printf ("parent starting second thread Wn"); 
err - pthread create(&tid2, NULL, thr fn2, NULL); 


if (err !- 0) 
err exit(err, "can't create thread 2"); 
sleep(1); 
printfoo("parent: Mn", fp); 
exit(0); 


11-4 pthread exit 参数 的 不 正确 使 用 
在 Linux 上 运行 此 程序 ， 得 到 : 


$ ./a.out 

thread 1: 
structure at 0x7f2c83682ed0 
foo.a = 1 


foo.b = 2 
foo.c = 3 
foo.d = 4 


parent starting second thread 
thread 2: ID is 139829159933696 
parent: 

structure at 0x7f2c83682ed0 

foo.a = -2090321472 

foo.b - 32556 
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foo.c = 
foo.d = 


当然 ， 运 行 结果 根据 内 存 体系 结构 、 编 译 器 以 及 线程 库 的 实现 会 有 所 不 同 。 在 Solaris 上 的 结果 
类 似 : 

$ ./a.out 

thread 1: 


structure at Oxffffffff7f0fbf30 
foo.a = 1 


or 


foo.b = 2 
foo.c = 3 
foo.d = 4 


parent starting second thread 
thread 2: ID is 3 


parent: 
structure at Oxffffffff7f0fbf30 
foo.a = -1 
foo.b - 2136969048 
foo = -1 


iiis - 2138049024 
可 以 看 到 ， 当 主线 程 访问 这 个 结构 时 ， 结 构 的 内 容 《〈 在 线程 tidl 的 栈 上 分 配 的 ) 已 经 改变 了 。 注 
意 第 二 个 线程 (tid2)〉 的 栈 是 如 何 覆 盖 第 一 个 线程 的 栈 的 。 为 了 解决 这 个 问题 ， 可 以 使 用 全 局 结 


构 ， 或 者 用 malloc 函数 分 配 结构 。 392 
在 Mac OS X 上 运行 的 结果 有 所 不 同 : 
$ ./a.out 
thread 1: 
structure at 0x1000b6f00 
foo.a = 1 
foo.b = 2 
foo.c = 3 
foo.d = 4 


parent starting second thread 
thread 2: ID is 4295716864 
parent: 

structure at 0x1000b6f00 
Segmentation fault (core dumped) 


在 这 种 情况 下 ， 父 进程 试图 访问 已 退出 的 第 一 个 线程 传 给 它 的 结构 时 ， 内 存 不 再 有 效 ， 这 时 得 到 
的 是 SIGSEGV 信和 号。 

FreeBSD 上 ， 父 进程 访问 内 存 时 ， 内 存 并 没有 被 覆 写 ， 得 到 的 结果 是 : 

thread 1: 


structure at Oxbf9fef88 
foo.a = 1 


foo.b = 2 
foo.c = 3 
foo.d = 4 


parent starting second thread 
thread 2: ID is 673279680 
parent: 
structure at Oxbf9fef88 
foo.a = 1 
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foo.b = 2 
foo.c = 3 
foo.d = 4 

虽然 线程 退出 后 ， 内 存 依然 是 完整 的 ， 但 我 们 不 能 期 望 情况 总 是 这 样 的 。 从 其 他 平台 上 的 结 

果 中 可 以 看 出 ， 情 况 并 不 都 是 这 样 的 。 = 


线程 可 以 通过 调用 pthread_cancel 函数 来 请 求 取 消 同 一 进程 中 的 其 他 线程 。 
#include <pthread.h> 


int pthread_cancel (pthread_t ftid); 





返回 值 : 若 成 功 ， 返 回 0， 否则 ， 返 回 错误 编号 


在 默认 情况 下 ，pthread_cancel 函数 会 使 得 由 tid 标识 的 线程 的 行为 表现 为 如 同调 用 了 参数 

为 PTHREAD_ CANCELED 的 pthread exit 函数 ， 但 是 ， 线 程 可 以 选择 忽略 取消 或 者 控制 如 何 被 
取消 。 我 们 将 在 12.7 节 中 详细 讨论 。 注 意 pthread_cancel 并 不 等 待 线 程 终止 ， 它 仅仅 提出 请 求 。 
线程 可 以 安排 它 退 出 时 需要 调用 的 函数 , 这 与 进程 在 退出 时 可 以 用 atexit 函数 C, 7.3 节 ) 
安排 退出 是 类 似 的 。 这 样 的 函数 称 为 线程 清理 处 理 程序 (thread cleanup handler)。 一 个 线程 可 以 
建立 多 个 清理 处 理 程 序 。 处 理 程序 记录 在 栈 中 ， 也 就 是 说 ， 它 们 的 执行 顺序 与 它们 注册 时 相反 。 


#include <pthread.h> 


void pthread cleanup push(void (*rtn) (void *), void *arg); 


void pthread cleanup pop(int execute); 


当 线 程 执 行 以 下 动作 时 ， 清 理 函 数 rtn 是 由 pthread_cleanup_push 函数 调度 的 ， 调 用 时 
只 有 一 个 参数 arg: 

。 调用 pthread_exit lj; 

。 响应 取消 请 求 时 ; 

e 用 非 零 execute 参数 调用 pthread_cleanup_pop Hj. 

如 果 execute 参数 设置 为 0， 清 理 函 数 将 不 被 调用 。 不 管 发 生 上 述 哪 种 情况 ，pPthreada_ 
cleanup pop 都 将 删除 上 次 pthread cleanup push 调用 建立 的 清理 处 理 程序 。 

这 些 函 数 有 一 个 限制 ， 由 于 它们 可 以 实现 为 宏 ， 所 以 必须 在 与 线程 相同 的 作用 域 中 以 匹配 对 
的 形式 使 用 。pthread_cleanup_push 的 宏 定 义 可 以 包含 字符 {， 这 种 情况 下 ,在 pthread_ 
cleanup pop 的 定义 中 要 有 对 应 的 匹配 字符 }。 








加 实例 
图 11-5 给 出 了 一 个 如 何 使 用 线程 清理 处 理 程序 的 例子 。 虽然 例子 是 人 为 编造 的 , 但 它 描述 了 
其 中 涉及 的 清理 机 制 。 注 意 ， 虽 然 我 们 从 来 没 想 过 要 传 一 个 参数 0 给 线程 启动 例 程 ， 但 还 是 需要 
把 pthread_cleanup_pop 调用 和 pthread_cleanup_push 调用 匹配 起 来 ， 否 则 ， 程 序 编译 
就 可 能 通 不 过 。 
#include "apue.h" 
#include <pthread.h> 





void 
cleanup(void *arg) 
{ 
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printf("cleanup: %s\n", (char *)arg); 


void * 
thr fnl(void *arg) 
1 
printf ("thread 1 start Mn"); 
pthread cleanup push(cleanup, "thread 1 first handler"); 
pthread cleanup push(cleanup, "thread 1 second handler"); 
printf("thread 1 push complete\n") ; 
if (arg) 
return((void *)1); 
pthread cleanup pop(0); 
pthread cleanup pop(0); 
return((void *)1); 


void * 
thr fn2(void *arg) 
{ 
printf ("thread 2 start\n"); 
pthread_cleanup_push(cleanup, "thread 2 first handler"); 
pthread_cleanup_push(cleanup, "thread 2 second handler"); 
printf("thread 2 push complete\n") ; 
if (arg) 
pthread exit((void *)2); 
pthread cleanup pop(0); 
pthread cleanup pop(0); 
pthread exit((void *)2); 


int 
main(void) 


{ 


int err; 
pthread_t tidl; tid2; 
void *tret; 


err = pthread create(&tidl, NULL, thr_fnl, (void *)1); 
if (err != 0) 
err_exit(err, "can't create thread 1"); 
err = pthread_create(&tid2, NULL, thr_fn2, (void *)1); 
if (err != 0) 
err_exit(err, "can't create thread 2"); 
err = pthread_join(tidl, &tret); 
if (err != 0) 
err_exit(err, "can't join with thread 1"); 
printf ("thread 1 exit code %ld\n", (long)tret); 
err = pthread_join(tid2, &tret); 


if (err != 0) 

err_exit(err, "can't join with thread 2"); 
printf ("thread 2 exit code %ld\n", (long)tret); 
exit (0); 





11-5 ”线程 清理 处 理 程序 
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在 Linux 或 者 Solaris 上 运行 图 11-5 中 的 程序 会 得 到 : 


$ ./a.out 

thread 1 start 

thread 1 push complete 

thread 2 start 

thread 2 push complete 

cleanup: thread 2 second handler 
cleanup: thread 2 first handler 
thread 1 exit code 1 

thread 2 exit code 2 


从 输出 结果 可 以 看 出 ， 两 个 线程 都 正确 地 启动 和 退出 了 ， 但 是 只 有 第 二 个 线程 的 清理 处 理 程 
序 被 调用 了 。 因 此 ， 如 果 线 程 是 通过 从 它 的 启动 例 程 中 返回 而 终止 的 话 ， 它 的 清理 处 理 程序 就 不 
会 被 调用 。 还 要 注意 ， 清 理 处 理 程序 是 按照 与 它们 安装 时 相反 的 顺序 被 调用 的 。 

如 果 在 FreeBSD 或 者 Mac OS X 上 运行 相同 的 程序 ， 可 以 看 到 程序 会 出 现 段 异 常 并 产生 core 
文件 。 这 是 因为 在 这 两 个 平台 上 ，pthread_cleanup_push 是 用 宏 实现 的 ， 而 宏 把 某 些 上 下 文 
存放 在 栈 上 。 当 线程 1 在 调用 pthread_cleanup_push 和 调用 pthread_cleanup_pop 之 间 
返回 时 , 栈 已 被 改写 , 而 这 两 个 平台 在 调用 清理 处 理 程 序 时 就 用 了 这 个 被 改写 的 上 下 文 。 在 Single 
UNIX Specification 中 ， 函 数 如 果 在 调用 pthread_cleanup_push #l pthread_cleanup_pop 
之 间 返 回 ， 会 产生 未 定义 行为 。 唯 一 的 可 移植 方法 是 调用 pthread_exit。 m 


现在 , 让 我 们 了 解 一 下 线程 函数 和 进程 函数 之 间 的 相似 之 处 ,图 11-6 总 结 了 这 些 相 似 的 函数 。 








fork pthread_create 创建 新 的 控制 流 
exit pthread_exit 从 现 有 的 控制 流 中 退出 


waitpid pthread_join 从 控制 流 中 得 到 退出 状态 

atexit pthread_cancel_push 注册 在 退出 控制 流 时 调用 的 函数 

getpid pthread_self 获取 控制 流 的 ID 

abort pthread_cancel 请 求 控制 流 的 非 正 常 退出 

图 11-6 进程 和 线程 原 语 的 比较 
在 默认 情况 下 , 线程 的 终止 状态 会 保存 直到 对 该 线程 调用 pthread_join。 如 果 线 程 已 经 被 

分 离 ， 线 程 的 底层 存储 资源 可 以 在 线程 终止 时 立即 被 收回 。 在 线程 被 分 离 后 ， 我 们 不 能 用 
pthread join 函数 等 待 它 的 终止 状态 ， 因 为 对 分 离 状态 的 线程 调用 pthread_join 会 产生 未 
定义 行为 。 可 以 调用 pthread_detach 分 离线 程 。 


#include <pthread.h> 





int pthread detach(pthread t tid); 





BREH: FRH, Eo 否则 ， 返 回 错误 编号 


在 下 一 章 里 ， 我 们 将 学 习 通 过 修改 传 给 pthread create 函数 的 线程 属性 ， 创 建 一 个 已 处 
于 分 离 状态 的 线程 。 


11.6 ”线程 同步 


当 多 个 控制 线程 共享 相同 的 内 存 时 ， 需 要 确保 每 个 线程 看 到 一 致 的 数据 视图 。 如 果 每 个 线程 
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使 用 的 变量 都 是 其 他 线程 不 会 读 取 和 修改 的 ， 那 么 就 不 存在 一 致 性 问题 。 同 样 ， 如 果 变 量 是 只 读 
的 ， 多 个 线程 同时 读 取 该 变量 也 不 会 有 一致 性 问题 。 但 是 ， 当 一 个 线程 可 以 修改 的 变量 ， 其 他 线 
程 也 可 以 读 取 或 者 修改 的 时 候 , 我 们 就 需要 对 这 些 线程 进行 同步 , 确保 它们 在 访问 变量 的 存储 内 容 时 不 
会 访问 到 无 效 的 值 。 

当 一 个 线程 修改 变量 时 ， 其 他 线程 在 读 取 这 个 变量 时 可 能 会 看 到 一 个 不 一 致 的 值 。 在 变量 修 
改 时 间 多 于 一 个 存储 器 访问 周期 的 处 理 器 结构 中 ， 当 存储 器 读 与 存储 器 写 这 两 个 周期 交叉 时 ， 这 
种 不 一 至 就 会 出 现 。 当 然 ， 这 种 行为 是 与 处 理 器 体系 结构 相关 的 ， 但 是 可 移植 的 程序 并 不 能 对 使 
用 何 种 处 理 器 体系 结构 做 出 任何 假设 。 

图 11-7 描述 了 两 个 线程 读 写 相同 变量 的 假设 例子 。 在 这 个 例子 中 ， 线 程 A 读 取 变量 然后 给 
这 个 变量 赋予 一 个 新 的 数值 ， 但 写 操作 需要 两 个 存储 器 周期 。 当 线程 B 在 这 两 个 存储 器 写 周期 中 
间 读 取 这 个 变量 时 ， 它 就 会 得 到 不 一 致 的 值 。 

为 了 解决 这 个 问题 ,线程 不 得 不 使 用 锁 ， 同 一 时 间 只 允许 一 个 线程 访问 该 变量 。 图 11-8 描述 
了 这 种 同步 。 如 果 线 程 B 希望 读 取 变 量 ， 它 首先 要 获取 锁 。 同 样 ， 当 线程 A 更 新 变量 时 ， 也 需要 
获取 同样 的 这 把 锁 。 这 样 ， 线 程 B 在 线程 A 释放 锁 以 前 就 不 能 读 取 变 量 。 

ABA 线程 B 


线程 A 线程 B 











时 间 1 


[5 


图 11-7 ”两 个 线程 的 交叉 存储 器 周期 图 11-8 ”两 个 线程 同步 内 存 访问 

两 个 或 多 个 线程 试图 在 同一 时 间 修 改 同 一 变量 时 ， 也 需要 进行 同步 。 考 虑 变量 增 量 操作 的 情 
况 〈 图 11-9)， 增 量 操作 通常 分 解 为 以 下 3 步 。 

C1) 从 内 存单 元 读 入 寄存 器 。 

(2) 在 寄存 器 中 对 变量 做 增 量 操作 。 

(3) 把 新 的 值 写 回 内 存单 元 。 

如 果 两 个 线程 试图 几乎 在 同一 时 间 对 同一 个 变量 做 增 量 操作 而 不 进行 同步 的 话 ， 结 果 就 可 能 
出 现 不 一 致 ， 变 量 可 能 比 原来 增加 了 1， 也 有 可 能 比 原来 增加 了 2， 有 具体 增加 了 1 还 是 2 要 取决 
于 第 二 个 线程 开始 操作 时 获取 的 数值 。 如 果 第 二 个 线程 执行 第 1 步 要 比 第 一 个 线程 执行 第 3 步 要 
早 ， 第 二 个 线程 读 到 的 值 与 第 一 个 线程 一 样 ， 为 变量 加 1， 然 后 写 回 去 ， 事实 上 没有 实际 的 效果 ， 
总 的 来 说 变量 只 增加 了 1。 

如 果 修 改 操作 是 原子 操作 ， 那 么 就 不 存在 竞争 。 在 前 面 的 例子 中 ， 如 果 增 加 1 只 需要 一 个 存储 器 
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周期 ， 那 么 就 没有 竞争 存在 。 如 果 数 据 总 是 以 顺序 一 致 出 现 的 ， 就 不 需要 额外 的 同步 。 当 多 个 线程 观 
察 不 到 数据 的 不 一 致 时 ， 那 么 操作 就 是 顺序 一 致 的 。 在 现代 计算 机 系统 中 ， 存 储 访问 需要 多 个 总 线 周 
期 ， 多 处 理 器 的 总 线 周期 通常 在 多 个 处 理 器 上 是 交叉 的 ， 所 以 我 们 并 不 能 保证 数据 是 顺序 一 致 的 。 
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图 11-9 两 个 非 同步 的 线程 对 同一 个 变量 做 增 量 操作 
在 顺序 一 致 环境 中 ， 可 以 把 数据 修改 操作 解释 为 运行 线程 的 顺序 操作 步骤 。 可 以 把 这 样 的 操 
作 描 述 为 “线程 A 对 变量 增加 了 1, 然后 线程 B 对 变量 增加 了 1, 所 以 变量 的 值 就 比 原来 的 大 2”, 
或 者 描述 为 “线程 B 对 变量 增加 了 1， 然 后 线程 A 对 变量 增加 了 1， 所 以 变量 的 值 就 比 原来 的 大 
2”。 这 两 个 线程 的 任何 操作 顺序 都 不 可 能 让 变量 出 现 除 了 上 述 值 以 外 的 其 他 值 。 
除了 计算 机 体系 结构 以 外 , 程序 使 用 变量 的 方式 也 会 引起 竞争 , 也 会 导致 不 一 致 的 情况 发 生 。 
例如 ， 我 们 可 能 对 某 个 变量 加 1， 然 后 基于 这 个 值 做 出 某 种 决定 。 因 为 这 个 增 量 操作 步骤 和 这 个 
决定 步骤 的 组 合并 非 原 子 操作 ， 所 以 就 给 不 一 致 情况 的 出 现 提 供 了 可 能 。 


11.6.1 Are 


可 以 使 用 pthread 的 互 斥 接口 来 保护 数据 ， 确 保 同一 时 间 只 有 一 个 线程 访问 数据 。 互 斥 量 
(mutex) 从 本 质 上 说 是 一 把 锁 ， 在 访问 共享 资源 前 对 互 斥 量 进行 设置 《加 锁 )， 在 访问 完成 后 释 
放 RB) 互 斥 量 。 对 互 斥 量 进行 加 锁 以 后 ， 任 何其 他 试图 再 次 对 互 斥 量 加 锁 的 线程 都 会 被 阻塞 
直到 当前 线程 释放 该 互 斥 锁 。 如 果 释 放 互 斥 量 时 有 一 个 以 上 的 线程 阻塞 ， 那 么 所 有 该 锁 上 的 阻塞 
线程 都 会 变 成 可 运行 状态 ， 第 一 个 变 为 运行 的 线程 就 可 以 对 互 斥 量 加 锁 ， 其 他 线程 就 会 看 到 互 斥 
量 依然 是 锁 着 的 ， 只 能 回去 再 次 等 待 它 重 新 变 为 可 用 。 在 这 种 方式 下 ， 每 次 只 有 一 个 线程 可 以 向 

前 执行 。 
只 有 将 所 有 线程 都 设计 成 遵守 相同 数据 访问 规则 的 ， 互 斥 机 制 才能 正常 工作 。 操 作 系 统 并 不 
会 为 我 们 做 数据 访问 的 串 行 化 。 如 果 人 允许 其 中 的 某 个 线程 在 没有 得 到 锁 的 情况 下 也 可 以 访问 共享 
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资源 ， 那 么 即使 其 他 的 线程 在 使 用 共享 资源 前 都 申请 锁 ， 也 还 是 会 出 现 数据 不 一 致 的 问题 。 

互 斥 变量 是 用 pthread mutex t 数据 类 型 表示 的 。 在 使 用 互 斥 变 量 以 前 ,必须 首先 对 它 进 
行 初始 化 ,可 以 把 它 设置 为 常量 PTHREAD_MUTEX_INITIALIZER( 只 适用 于 静态 分 配 的 互 斥 量 )， 
也 可 以 通过 调用 pthread_mutex_init 函数 进行 初始 化 。 如 果 动 态 分 配 互 斥 量 (例如 ， 通 过 调 
用 malloc 函数 )， 在 释放 内 存 前 需要 调用 pthread mutex destroy. 


#include <pthread.h> 


int pthread mutex init(pthread mutex t *restrict mutex, 


const pthread mutexattr t *restrict attr); 
int pthread mutex destroy(pthread mutex t *mutex) ; 
两 个 函数 的 返回 值 : 若 成 功 ， 返 回 0， 和 否则， 返回 错误 编号 
要 用 默认 的 属性 初始 化 互 斥 量 ， 只 需 把 attr 设 为 NULL。 我 们 将 在 12.4 节 中 讨论 互 斥 量 
属性 。 
对 互 斥 量 进行 加 锁 ， 需 要 调用 pthread_mutex_lock。 如 果 互 斥 量 已 经 上 锁 ， 调 用 线程 将 
阻塞 直到 互 斥 量 被 解锁 。 对 互 斥 量 解锁 ， 需 要 调用 pthread_mutex_unlock. 


#include <pthread.h> 








int pthread_mutex_lock(pthread_mutex_t *mutex) ; 


int pthread mutex trylock(pthread mutex t *mutex) ; 


int pthread mutex unlock(pthread mutex t *mutex); 


所 有 函数 的 返回 值 ; 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


如 果 线 程 不 希望 被 阻塞 ， 它 可 以 使 用 pthread_mutex_trylock 尝试 对 互 斥 量 进行 加 锁 。 
如 果 调 用 pthread_mutex_trylock 时 互 斥 量 处 于 未 锁 住 状态 ， 那 么 pthread_mutex_trylock 
将 锁 住 互 斥 量 ， 不 会 出 现 阻 塞 直接 返 回 0， 否 则 pthread mutex trylock 就 会 失败 ， 不 能 锁 
住 互 斥 量 ， 返 回 EBUSY. 





a XD 

图 11-10 描述 了 用 于 保护 某 个 数据 结构 的 互 斥 量 。 当 一 个 以 上 的 线程 需要 访问 动态 分 配 的 对 
象 时， 我们 可 以 在 对 象 中 媒 入 引用 计数 ， 确 保 在 所 有 使 用 该 对 象 的 线程 完成 数据 访问 之 前 ， 该 对 
象 内 存 空间 不 会 被 释放 。 [300] 

在 对 引用 计数 加 1、 减 1、 检 查 引 用 计数 是 否 到 达 0 这 些 操作 之 前 需要 锁 住 互 斥 量 。 在 
foo alloc 函数 中 将 引用 计数 初始 化 为 1 时 没 必要 加 锁 ， 因 为 在 这 个 操作 之 前 分 配 线程 是 唯一 
引用 该 对 象 的 线程 。 但 是 在 这 之 后 如 果 要 将 该 对 象 放 到 一 个 列表 中 ， 那 么 它 就 有 可 能 被 别 的 线程 
发 现 ， 这 时 候 需 要 首先 对 它 加 锁 。 

在 使 用 该 对 象 前 , 线程 需要 调用 foo hold 对 这 个 对 象 的 引用 计数 加 1。 当 对 象 使 用 完毕 时 ， 
必须 调用 foo rele 释放 引用 。 最 后 一 个 引用 被 释放 时 ， 对 象 所 占 的 内 存 空间 就 被 释放 。 

在 这 个 例子 中 ,我 们 忽略 了 线程 在 调用 foo hold 之 前 是 如 何 找到 对 象 的 。 如 果 有 另 一 个 线 
程 在 调用 foo hold 时 阻塞 等 待 互 斥 锁 ， 这 时 即使 该 对 象 引 用 计数 为 0，foo_rele 释放 该 对 象 
的 内 存 仍然 是 不 对 的 。 可 以 通过 确保 对 象 在 释放 内 存 前 不 会 被 找到 这 种 方式 来 避免 上 述 问题 。 可 
以 通过 下 面 的 例子 来 看 看 如 何 做 到 这 一 点 。 a 
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#include <stdlib.h> 
#include <pthread.h> 


struct foo { 


int f count; 
pthread mutex t f lock; 

int f id; 

/* ... more stuff here ... */ 


H 


struct foo * 
foo alloc(int id) /* allocate the object */ 
{ 


struct foo *fp; 


if ((fp = malloc(sizeof(struct foo))) != NULL) { 
fp->f_count = 1; 
fp->f_id = id; 
if (pthread_mutex_init (&fp->f_lock, NULL) != 0) { 
free(fp); 
return (NULL) ; 
} 
/* ... continue initialization ... */ 
} 


return(fp); 


void 
foo_hold(struct foo *fp) /* add a reference to the object */ 
{ 

pthread_mutex_lock (&fp->f£_lock) ; 

fp->f_count++; 

pthread_mutex_unlock (&fp->f_lock) ; 


void 
foo_rele(struct foo *fp) /* release a reference to the object */ 
{ 
pthread_mutex_lock(&fp->f_lock); 
if (--fp->f_count == 0) { /* last reference */ 
pthread mutex unlock(&fp-»f lock); 
pthread mutex destroy(&fp-»f lock); 
free(fp); 
) else { 
pthread mutex unlock(&fp-»5f lock); 


11-10 使 用 互 斥 量 保护 数据 结构 


11.6.2 ”避免 死 锁 


如 果 线 程 试图 对 同一 个 互 斥 量 加 锁 两 次 , 那么 它 自身 就 会 陷入 死 锁 状 态 , 但 是 使 用 互 斥 量 时 ， 
还 有 其 他 不 太 明 显 的 方式 也 能 产生 死 锁 。 例 如 ， 程 序 中 使 用 一 个 以 上 的 互 斥 量 时 ， 如 果 多 许 一 个 
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线程 一 直 占 有 第 一 个 互 斥 量 ， 并 且 在 试图 锁 住 第 二 个 互 斥 量 时 处 于 阻塞 状态 ， 但 是 拥有 第 二 个 互 
斥 量 的 线程 也 在 试图 锁 住 第 一 个 互 斥 量 。 因 为 两 个 线程 都 在 相互 请 求 另 一 个 线程 拥有 的 资源 ， 所 
以 这 两 个 线程 都 无 法 向 前 运行 ， 于 是 就 产生 死 锁 。 

可 以 通过 仔细 控制 互 斥 量 加 锁 的 顺序 来 避免 死 锁 的 发 生 。 例 如 ， 假 设 需要 对 两 个 互 斥 量 A 和 
B 同时 加 锁 。 如 果 所 有 线程 总 是 在 对 互 斥 量 B 加 锁 之 前 锁 住 互 斥 量 A， 那 么 使 用 这 两 个 互 斥 量 就 
不 会 产生 死 锁 〈 当 然 在 其 他 的 资源 上 仍 可 能 出 现 死 锁 )。 类 似 地 ， 如 果 所 有 的 线程 总 是 在 锁 住 互 
斥 量 A 之 前 锁 住 互 斥 量 B， 那 么 也 不 会 发 生死 锁 。 可 能 出 现 的 死 锁 只 会 发 生 在 一 个 线程 试图 锁 住 
另 一 个 线程 以 相反 的 顺序 锁 住 的 互 斥 量 。 

有 时 候 ， 应 用 程序 的 结构 使 得 对 互 斥 量 进行 排序 是 很 困难 的 。 如 果 涉 及 了 太 多 的 锁 和 数据 结 
构 ， 可 用 的 函数 并 不 能 把 它 转换 成 简单 的 层次 ， 那 么 就 需要 采用 另外 的 方法 。 在 这 种 情况 下 ， 可 以 
先 释放 占有 的 锁 ， 然 后 过 一 段 时间 再 试 。 这 种 情况 可 以 使 用 pthread_mutex_trylock 接口 避免 
死 锁 。 如 果 已 经 占有 某 些 锁 而 且 pthread mutex_trylock 接口 返回 成 功 ， 那 么 就 可 以 前 进 。 但 
是 ， 如 果 不 能 获取 锁 ， 可 以 先 释放 已 经 占有 的 锁 ， 做 好 清理 工作 ， 然 后 过 一 段 时 间 再 重新 试 。 


E EH 
在 这 个 例子 中 ， 我 们 更 新 了 图 11-10 的 程序 ， 展 示 了 两 个 互 斥 量 的 使 用 方法 。 在 同时 需要 两 个 
互 斥 量 时 ， 总 是 让 它们 以 相同 的 顺序 加 锁 ， 这 样 可 以 避免 死 锁 。 第 二 个 互 斥 量 维护 着 一 个 用 于 跟踪 


foo 数据 结构 的 散 列 列表 。 这 样 hashlock 互 斥 量 既 可 以 保护 foo 数据 结构 中 的 散 列表 fh, May al 
以 保护 散 列 链 字段 f next. foo 结构 中 的 £ lock 互 斥 量 保护 对 foo 结构 中 的 其 他 字段 的 访问 。|402 


#include <stdlib.h> 
#include <pthread.h> 


#define NHASH 29 
#define HASH (id) (((unsigned long) id) sNHASH) 


struct foo *fh[NHASH]; 
pthread mutex t hashlock - PTHREAD MUTEX INITIALIZER; 


struct foo { 


int f count; 

pthread mutex t f lock; 

int f id; 

struct foo * f next; /* protected by hashlock */ 
/* ... more stuff here ... */ 


}; 


struct foo * 
foo alloc(int id) /* allocate the object */ 
{ 

struct foo *fp; 

int idx; 


if ((fp = malloc(sizeof(struct foo))) !- NULL) { 
fp-»f count = 1; 
fp-»5f id = id; 
if (pthread mutex init(&fp-»f lock, NULL) != 0) { 


403 
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free (fp); 
return (NULL); 
} 
idx = HASH (id); 
pthread mutex lock(&hashlock); 
fp->f next = fh[idx]; 
fh[idx] = fp; 
pthread_mutex_lock (&fp->f_lock) ; 
pthread mutex unlock(&hashlock); 
/* ... continue initialization ... */ 
pthread mutex unlock(&fp-»f lock); 
) 
return(fp); 


void 
foo hold(struct foo *fp) /* add a reference to the object */ 
{ 

pthread_mutex_lock (&fp->f_lock) ; 

fp->f_count++; 

pthread_mutex_unlock (&fp->f_lock) ; 


struct foo * 
foo_find(int id) /* find an existing object */ 


{ 
struct foo *fp; 


pthread_mutex_lock (&hashlock) ; 
for (fp = fh[HASH(id)]; fp != NULL; fp = fp->f_next) { 
if (fp->f_id == id) { 
foo hold(fp); 
break; 


} 
pthread_mutex_unlock (&hashlock) ; 


return (fp); 


void 


foo_rele(struct foo *fp) /* release a reference to the object */ 


{ 
struct foo *tfp; 
int idx; 


pthread mutex lock(&fp-»5f lock); 
if (fp-»f count == 1) ( /* last reference */ 
pthread mutex unlock(&fp-»f lock); 
pthread mutex lock(&hashlock); 
pthread mutex lock(&fp-»f lock); 
/* need to recheck the condition */ 
if (fp-»f count t= 1) { 
fp-»f count--; 
pthread mutex unlock(&fp-»f lock); 
pthread mutex unlock(&hashlock); 
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return; 
} 
/* remove from list */ 
idx = HASH(fp->f_id); 
tfp = fh[idx]; 
if (tfp -- fp) ( 

fh[idx] = fp-»f next; 
) else { 

while (tfp-»f next != fp) 

tfp = tfp->f next; 

tfp-»5f next = fp->f next; 
} 
pthread mutex unlock(&hashlock); 
pthread mutex unlock(&fp-»f lock); 
pthread mutex destroy(&fp-»f lock); 
free(fp); 

) else ( 

fp-»5f count--; 
pthread mutex unlock(&fp-»5f lock); 


图 11-11 使 用 两 个 互 斥 量 

比较 图 11-11 和 图 11-10， 可 以 看 出 ， 分 配 函 数 现在 锁 住 了 散 列 列表 锁 ， 把 新 的 结构 添加 到 了 
散 列 桶 中 ， 而 且 在 对 散 列 列表 的 锁 解锁 之 前 ， 先 锁定 了 新 结构 中 的 互 斥 量 。 因 为 新 的 结构 是 放 在 全 
局 列表 中 的 ， 其 他 线程 可 以 找到 它 ， 所 以 在 初始 化 完成 之 前 ， 需 要 阻塞 其 他 线程 试图 访问 新 结构 。 

foo find 函数 锁 住 散 列 列表 锁 ， 然 后 搜索 被 请 求 的 结构 。 如 果 找 到 了 ， 就 增加 其 引用 计数 
并 返回 指向 该 结构 的 指针 。 注 意 ， 加 锁 的 顺序 是 ， 先 在 foo find 函数 中 锁定 散 列 列表 锁 ， 然 后 
再 在 foo_hold 函数 中 锁定 foo 结构 中 的 flock 互 斥 量 。 

现在 有 了 两 个 锁 以 后 ，foo_rele 函数 就 变 得 更 加 复杂 了 。 如 果 这 是 最 后 一 个 引用 ， 就 需要 对 
这 个 结构 互 斥 量 进行 解锁 , 因为 我 们 需要 从 散 列 列表 中 删除 这 个 结构 , 这 样 才 可 以 获取 散 列 列表 锁 ， 
然后 重新 获取 结构 互 斥 量 。 从 上 一 次 获得 结构 互 斥 量 以 来 我 们 可 能 被 阻塞 着 ， 所 以 需要 重新 检查 条 
件 ， 判 断 是 否 还 需要 释放 这 个 结构 。 如 果 另 一 个 线程 在 我 们 为 满足 锁 顺 序 而 阻塞 时 发 现 了 这 个 结构 
并 对 其 引用 计数 加 1， 那 么 只 需要 简单 地 对 整个 引用 计数 减 1， 对 所 有 的 东西 解锁 ， 然 后 返回 。 

这 种 锁 方法 很 复杂 ， 所 以 我 们 需要 重新 审视 原来 的 设计 。 我 们 也 可 以 使 用 散 列 列表 锁 来 保护 
结构 引用 计数 , 使 事情 大 大 简化 。 结构 互 斥 量 可 以 用 于 保护 foo 结构 中 的 其 他 任何 东西 . 图 11-12 
反映 了 这 种 变化 。 

#include <stdlib.h> 


#include <pthread.h> 


#define NHASH 29 
#define HASH (id) (((unsigned long)id)%NHASH) 


struct foo *fh[NHASH]; 
pthread_mutex_t hashlock = PTHREAD_MUTEX_INITIALIZER; 


struct foo { 
int f_count; /* protected by hashlock */ 


pthread_mutex_t f_lock; 
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int f tas 
struct foo * f_next; /* protected by hashlock */ 
/* ... more stuff here ... */ 


struct foo * 
foo alloc(int id) /* allocate the object */ 
{ 

struct foo *fp; 

int idx; 


if ((fp = malloc(sizeof(struct foo))) != NULL) { 
fp->f_count = 1; 
fp->f_id = id; 
if (pthread_mutex_init (&fp->f_lock, NULL) != 0) { 
free(fp); 
return (NULL); 
} 
idx = HASH (id); 
pthread mutex lock(&hashlock); 
fp-»f next = fh[idx]; 
fh[idx] = fp; 
pthread mutex lock(&fp-»5f lock); 
pthread mutex unlock(&hashlock); 
/* ... continue initialization ... */ 
pthread mutex unlock(&fp-»f lock); 
) 
return (fp); 


void 
foo_hold(struct foo *fp) /* add a reference to the object */ 
{ 

pthread mutex lock(&hashlock); 

fp->f_count++; 

pthread_mutex_unlock (&hashlock) ; 


struct foo * 
foo_find(int id) /* find an existing object */ 


{ 
struct foo *fp; 


pthread mutex lock(&hashlock); 
for (fp = fh[HASH(id)]; fp != NULL; fp = fp-»f next) { 
if (fp->f_id == id) { 
fp->f_count++; 
break; 


) 


pthread mutex unlock(&hashlock); 
return (fp); 


void 
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foo_rele(struct foo *fp) /* release a reference to the object */ 
{ 

struct foo “tip; 

int idx; 


pthread mutex lock(&hashlock); 
if (--fp-»5f count == 0) { /* last reference, remove from list */ 
idx = HASH (fp->f_id); 
tfp = fh[idx]; 
if (tfp == fp) { 
fh[idx] = fp->f_next; 
} else { 
while (tfp->f_next != fp) 
tfp = tfp->f_next; 
tfp->f_next = fp->f_next; 
} 
pthread mutex unlock(&hashlock); 
pthread mutex destroy(&fp-»f lock); 
free(fp); 
} else { 
pthread mutex unlock(&hashlock); 
} 





图 11-12 简化 的 锁 
注意 ,与 图 11-11 中 的 程序 相 比 ， 图 11-12 中 的 程序 就 简单 多 了 。 两 种 用 途 使 用 相同 的 锁 时 ， 
围绕 散 列 列表 和 引用 计数 的 锁 的 排序 问题 就 不 存在 了 。 多 线程 的 软件 设计 涉及 这 两 者 之 间 的 折 
中 。 如 果 锁 的 粒度 太 粗 ， 就 会 出 现 很 多 线程 阻塞 等 待 相同 的 锁 ， 这 可 能 并 不 能 改善 并 发 性 。 如 果 
锁 的 粒度 太 细 , 那么 过 多 的 锁 开销 会 使 系统 性 能 受到 影响 ,而 且 代 码 变 得 复杂 。 作 为 一 个 程序 员 ， 
需要 在 满足 锁 需求 的 情况 下 ， 在 代码 复杂 性 和 性 能 之 间 找 到 正确 的 平衡 。 a 


11.6.3 reat pthread_mutex_timedlock 


当 线 程 试 图 获取 一 个 已 加 锁 的 互 斥 量 时 ，pthread_mutex_timedlock 互 斥 量 原 语 允许 绑 
定 线程 阻塞 时 间 。pthread mutex timedlock KX pthread mutex lock 是 基本 等 价 的 ， 
但 是 在 达到 超时 时 间 值 时 ，pthread_mutex_timedlock 不 会 对 互 斥 量 进行 加 锁 ， 而 是 返回 错 
误 码 ETIMEDOUT. 


#include <pthread.h> 
#include <time.h> 


int pthread mutex timedlock(pthread mutex t *restrict mutex, 


const struct timespec *restrict fsptr); 
返回 值 ， 若 成 功 ， 返 回 O; 否则， 返回 错误 编号 
超时 指定 愿意 等 待 的 绝对 时 间 与 相对 时 间 对 比 而 言 ， 指 定 在 时 间 X 之 前 可 以 阻塞 等 待 ， 而 
不 是 说 愿意 阻塞 了 秒 )。 这 个 超时 时 间 是 用 timespec 结构 来 表示 的 , 它 用 秒 和 纳 秒 来 描述 时 间 。 





KB 
图 11-13 给 出 了 如 何 用 pthread_mutex_timedlock 避免 永久 阻塞 。 


328 第 11 章 线程 





#include "apue.h" 
#include <pthread.h> 


int 
main (void) 
{ 
int err; 
struct timespec tout; 
struct tm *tmp; 
char buf[64]; 
pthread_mutex_t lock = PTHREAD_MUTEX_INITIALIZER; 


pthread mutex lock(&lock); 
printf("mutex is locked\n") ; 
clock gettime(CLOCK REALTIME, &tout); 
tmp = localtime(&tout.tv sec); 
strftime(buf, sizeof(buf), "$r", tmp); 
printf("current time is %s\n", buf); 
tout.tv sec += 10; /* 10 seconds from now */ 
/* caution: this could lead to deadlock */ 
err - pthread mutex timedlock(&lock, &tout); 
clock gettime(CLOCK REALTIME, &tout); 
tmp = localtime(&tout.tv sec); 
strftime(buf, sizeof(buf), "£r", tmp); 
printf("the time is now %s\n", buf); 
if (err == 0) 

printf ("mutex locked again! Wn"); 
else 

printf("can't lock mvtex again:%s\n",strerror(err)); 
exit(0); 


图 11-13 使 用 pthread mutex timedlock 


图 11-13 中 的 程序 运行 结果 输出 如 下 : 


$ ./a.out 

mutex is locked 

current time is 11:41:58 AM 

the time is now 11:42:08 AM 

can't lock mutex again: Connection timed out 


这 个 程序 故意 对 它 已 有 的 互 斥 量 进行 加 锁 ， 目 的 是 演示 pthread mutex timedlock 是 如 

何 工作 的 。 不 推荐 在 实际 中 使 用 这 种 策略 ， 因 为 它 会 导致 死 锁 。 
注意 ， 阻 塞 的 时 间 可 能 会 有 所 不 同 ， 造 成 不 同 的 原因 有 多 种 : 开始 时 间 可 能 在 某 秒 的 中 间 位 
置 ， 系 统 时 钟 的 精度 可 能 不 足以 精确 到 支持 我 们 指定 的 超时 时 间 值 ， 或 者 在 程序 继续 运行 前 ， 调 

度 延迟 可 能 会 增加 时 间 值 。 m 
Mac OS X 10.6.8 还 没有 支持 pthread mutex timedlock, 但 是 FreeBSD 8.0, Linux 3.2.0 
以 及 Solaris 10 支持 该 函数 ， 虽 然 Solaris 仍然 把 它 放 在 实时 库 librt P. Solaris 10 还 提供 了 另 一 
个 使 用 相对 超时 时 间 的 函数 。 


11.6.4 ” 读 写 锁 
读 写 锁 (reader-writer lock) 与 互 斥 量 类 似 ， 不 过 读 写 锁 允 许 更 高 的 并 行 性 。 互 斥 量 要 么 是 锁 
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住 状态 ， 要 么 就 是 不 加 锁 状 态 ， 而 且 一 次 只 有 一 个 线程 可 以 对 其 加 锁 。 读 写 锁 可 以 有 3 种 状态 : 
读 模式 下 加 锁 状 态 ， 写 模式 下 加 锁 状 态 ， 不 加 锁 状 态 。 一 次 只 有 一 个 线程 可 以 占有 写 模 式 的 读 写 
锁 ， 但 是 多 个 线程 可 以 同时 占有 读 模式 的 读 写 锁 。 

当 读 写 锁 是 写 加 锁 状 态 时 , 在 这 个 锁 被 解锁 之 前 , 所 有 试图 对 这 个 锁 加 锁 的 线程 都 会 被 阻塞 。 
当 读 写 锁 在 读 加 锁 状 态 时 ， 所 有 试图 以 读 模式 对 它 进行 加 锁 的 线程 都 可 以 得 到 访问 权 ， 但 是 任何 
希望 以 写 模式 对 此 锁 进 行 加 锁 的 线程 都 会 阻塞 ， 直 到 所 有 的 线程 释放 它们 的 读 锁 为 止 。 虽 然 各 操 
作 系 统 对 读 写 锁 的 实现 各 不 相同 ， 但 当 读 写 锁 处 于 读 模式 锁 住 的 状态 ， 而 这 时 有 一 个 线程 试图 以 
写 模式 获取 锁 时 ， 读 写 锁 通常 会 阻塞 随后 的 读 模 式 锁 请 求 。 这 样 可 以 避免 读 模式 锁 长 期 占用 ， 而 
等 待 的 写 模式 锁 请 求 一 直 得 不 到 满足 。 

读 写 锁 非常 适合 于 对 数据 结构 读 的 次 数 远大 于 写 的 情况 。 当 读 写 锁 在 写 模式 下 时 ， 它 所 保护 的 数据 
结构 就 可 以 被 安全 地 修改 , 因为 一 次 只 有 一 个 线程 可 以 在 写 模式 下 拥有 这 个 锁 。 当 读 写 锁 在 读 模 式 下 时 ， 
只 要 线程 先 获 取 了 读 模 式 下 的 读 写 锁 ， 该 锁 所 保护 的 数据 结构 就 可 以 被 多 个 获得 读 模 式 锁 的 线程 读 取 。 

读 写 锁 也 叫做 共享 互 斥 锁 (shared-exclusive lock)。 当 读 写 锁 是 读 模式 锁 住 时 ， 就 可 以 说 成 是 
以 共享 模式 锁 住 的 。 当 它 是 写 模 式 锁 住 的 时 候 ， 就 可 以 说 成 是 以 互 斥 模式 锁 住 的 。 

与 互 斥 量 相 比 ， 读 写 锁 在 使 用 之 前 必须 初始 化 ， 在 释放 它们 底层 的 内 存 之 前 必须 销毁 。 


#include <pthread.h> 


int pthread rwlock init(pthread rwlock t *restrict rwlock, 
const pthread rwlockattr t *restrict attr); 


int pthread rwlock destroy(pthread rwlock t *rwlock); 


两 个 函数 的 返回 值 : 若 成 功 ， 返 回 0， 和 否则， 返回 错误 编号 





读 写 锁 通 过 调用 pthread rwlock init 进行 初始 化 。 如 果 希 望 读 写 锁 有 默认 的 属性 ， 可 
以 传 一 个 null 指针 给 attr, RATRE 12.4.2 节 中 讨论 读 写 锁 的 属性 。 

Single UNIX Specification 在 XSI 扩展 中 定义 了 PTHREAD_RWLOCK_INITIALIZER 常量 。 如 
果 默 认 属 性 就 足够 的 话 ， 可 以 用 它 对 静态 分 配 的 读 写 锁 进行 初始 化 。 

在 释放 读 写 锁 占用 的 内 存 之 前 ， 需 要 调用 pthread rwlock destroy 做 清理 工作 。 如 果 
pthread rwlock init 为 读 写 锁 分 配 了 资源 ，pthread_rwlock_destroy 将 释放 这 些 资源 。 
如 果 在 调用 pthread rwlock destroy 之 前 就 释放 了 读 写 锁 占用 的 内 存 空间 ， 那 么 分 配给 这 
个 锁 的 资源 就 会 丢失 。 

要 在 读 模式 下 锁定 读 写 锁 ， 需 要 调用 pthread_rwlock_rdlock。 要 在 写 模式 下 锁定 读 写 锁 ， 
需要 调用 pthread_rwlock_wrlock。 不 管 以 何 种 方式 锁 住 读 写 锁 ， 都 可 以 调用 pthread_rwlock_ 
unlock 进行 解锁 。 


#include <pthread.h> 





int pthread rwlock rdlock(pthread rwlock t *rwlock) ; 


int pthread rwlock wrlock(pthread rwlock t *rwlock) ; 


int pthread rwlock unlock(pthread rwlock t *rwlock) ; 


所 有 函数 的 返回 值 : 若 成 功 ， 返 回 0， 和 否则 ， 返 回 错误 编号 





各 种 实现 可 能 会 对 共享 模式 下 可 获取 的 读 写 锁 的 次 数 进行 限制 ， 所 以 需要 检查 pthread_ 
rwlock_rdlock 的 返回 值 。 即 使 pthread _rwlock_wrlock 和 Pthread_rwlock_unlock 有 错误 
返回 ,而且 从 技术 上 来 讲 ， 在 调用 函数 时 应 该 总 是 检查 错误 返回 ,但 是 如 果 锁 设计 合理 的 话 ， 就 不 需要 
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检查 它们 。 错 误 返 回 值 的 定义 只 是 针对 不 正确 使 用 读 写 锁 的 情况 〈 如 未 经 初始 化 的 锁 )， 或 者 试图 获取 
已 拥有 的 锁 从 而 可 能 产生 死 锁 的 情况 。 但 是 需要 注意 ， 有 些 特 定 的 实现 可 能 会 定义 另外 的 错误 返回 。 
Single UNIX Specification 还 定义 了 读 写 锁 原 语 的 条 件 版 本 。 
#include <pthread.h> 


int pthread rwlock tryrdlock(pthread rwlock t *rwlock); 


int pthread rwlock trywrlock(pthread rwlock t *rwlock) ; 
两 个 函数 的 返回 值 : 若 成 功 ， 返 回 0 否则， 返回 错误 编号 
可 以 获取 锁 时 ， 这 两 个 函数 返回 0。 和 否则， 它们 返回 错误 EBUSY。 这 两 个 函数 可 以 用 于 我 们 
前 面 讨 论 的 遵守 某 种 锁 层 次 但 还 不 能 完全 避免 死 锁 的 情况 。 





m Scl 


图 11-14 中 的 程序 解释 了 读 写 锁 的 使 用 。 作 业 请 求 队列 由 单个 读 写 锁 保 护 。 这 个 例子 给 出 了 
图 11-1 所 示 的 一 种 可 能 的 实现 ， 多 个 工作 线程 获取 单个 主线 程 分 配给 它们 的 作业 。 


#include <stdlib.h> 
#include <pthread.h> 





struct job { 
struct job *j_next; 
struct job *j prev; 
pthread t j_id; /* tells which thread handles this job */ 
/* ... more stuff here ... */ 
hi 


struct queue { 
struct job *q head; 
struct job *q tail; 
pthread rwlock t q lock; 
}; 


/* 
* Initialize a queue. 
“y: 
int 
queue_init (struct queue *qp) 
{ 
int err; 


qp->q_head = NULL; 
qp->q tail = NULL; 
err = pthread_rwlock_init (&qp->q_lock, NULL); 


if (err != 0) 

return (err); 
/* ... continue initialization ... */ 
return (0); 


} 


/* 
* Insert a job at the head of the queue. 
*f 
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void 
job_insert (struct queue *qp, struct job *jp) 
{ 
pthread rwlock wrlock(&qp-»q lock); 
jp-»j next = qp-»q head; 
jp-»^j prev = NULL; 
if (gqp-»q head != NULL) 
qp-»q head-»5j prev = jp; 
else 
qp-»q tail = jp; /* list was empty */ 
qp-»q head = jp; 
pthread rwlock unlock(&qp-»q lock); 


/* 
* Append a job on the tail of the queue. 
+f 
void 
job_append(struct queue *qp, struct job *jp) 
{ 
pthread rwlock wrlock(&qp-»q lock); 
jp-»j next = NULL; 
jP-^j prev = qp-?q tail; 
if (qp-»q tail !- NULL) 
qp->q_tail->j_next = jp; 
else 
qp->q_head = jp; /* list was empty */ 
qp->q_tail = jp; 
pthread_rwlock_unlock (&qp->q_lock) ; 


/* 
* Remove the given job from a queue. 
*j 
void 
job remove(struct queue *qp, struct job *jp) 
{ 
pthread rwlock wrlock(&qp-»q lock); 
if (jp == qp->q head) { 
qp-»q head = jp-»j next; 
if (qp-»q tail == jp) 
qp-»q tail = NULL; 
else 
jp->j_next->j_prev = jp-?j prev; 
) else if (jp == qp-?q tail) { 
qp-»q tail = jp-»j prev; 
jP-»j prev-»5j next = jp-»5j next; 
) else ( 
jp->j_prev->j_next = jp-»5j next; 
jp->j_next->j_prev = jp-»5j prev; 


} 
pthread_rwlock_unlock (&qp->q_lock) ; 


/* 
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* Find a job for the given thread ID. 
x 
struct job * 
job find(struct queue *qp, pthread t id) 
{ 

struct job *jp; 


if (pthread_rwlock_rdlock(&qp->q_lock) != 0) 
return (NULL) ; 


for (jp = qp->q_head; jp != NULL; jp = jp->j_next) 
if (pthread_equal(jp->j_id, id)) 
break; 


pthread rwlock unlock(&qp-»q lock); 
return(jp); 


图 11-14 使 用 读 写 锁 
在 这 个 例子 中 ， 凡 是 需要 向 队列 中 增加 作业 或 者 从 队列 中 删除 作业 的 时 候 ， 都 采用 了 写 模 式 来 锁 
住 队 列 的 读 写 锁 。 不 管 何 时 搜索 队列 , 都 需要 获取 读 模 式 下 的 锁 ,， 允许 所 有 的 工作 线程 并 发 地 搜索 队列 。 
在 这 种 情况 下 ， 只 有 在 线程 搜索 作业 的 频率 远 远 高 于 增加 或 删除 作业 时 ， 使 用 读 写 锁 才 可 能 改善 性 能 。 
工作 线程 只 能 从 队列 中 读 取 与 它们 的 线程 ID 匹配 的 作业 。 由 于 作业 结构 同一 时 间 只 能 由 一 
个 线程 使 用 ， 所 以 不 需要 额外 的 加 锁 。 B 


11.6.5“” 带 有 超时 的 读 写 锁 


H HJR HÉ, Single UNIX Specification 提供 了 带 有 超时 的 读 写 锁 加 锁 函 数 ， 使 应 用 程序 在 获取 
读 写 锁 时 避免 陷入 永久 阻塞 状态 。 这 两 个 函数 是 pthread rwlock timedrdlock 和 pthread_ 
rwlock timedwrlock. 
#include <pthread.h> 
#include <time.h> 


int pthread rwlock timedrdlock(pthread rwlock t *restrict rwlock, 
const struct timespec *restrict (sptr); 


int pthread rwlock timedwrlock(pthread rwlock t *restrict rwlock, 
const struct timespec *restrict I(sptr) ; 


两 个 函数 的 返回 值 ， 若 成 功 ， 返 回 0， 否 则 ， 返 回 错误 编号 








这 两 个 函数 的 行为 与 它们 “不 计时 的 ”版 本 类 似 。tsptr 参数 指向 timespec 结构 ， 指 定 线 程 
应 该 停止 阻塞 的 时 间 。 如 果 它 们 不 能 获取 锁 ， 那 么 超时 到 期 时 ， 这 两 个 函数 将 返回 ETIMEDOUT 
错误 。 与 pthread mutex timedlock 函数 类 似 ， 超 时 指定 的 是 绝对 时 间 ， 而 不 是 相对 时 间 。 


11.6.6 条件 变量 


条 件 变量 是 线程 可 用 的 另 一 种 同步 机 制 。 条 件 变 量 给 多 个 线程 提供 了 一 个 会 合 的 场所 。 条 件 
变量 与 互 斥 量 一 起 使 用 时 ， 人 允许 线程 以 无 竞争 的 方式 等 待 特定 的 条 件 发 生 。 
条 件 本 身 是 由 互 斥 量 保护 的 。 线 程 在 改变 条 件 状态 之 前 必须 首先 锁 住 互 斥 量 。 其 他 线程 在 获 
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得 互 斥 量 之 前 不 会 察觉 到 这 种 改变 ， 因 为 互 斥 量 必须 在 锁定 以 后 才能 计算 条 件 。 

在 使 用 条 件 变量 之 前 ， 必 须 先 对 它 进 行 初始 化 。 由 pthread cond t 数据 类 型 表示 的 条 件 变量 
可 以 用 两 种 方式 进行 初始 化 ,可 以 把 常量 PTHREAD_COND_INITIALIZER 赋 给 静态 分 配 的 条 件 变量 ，[413 
但 是 如 果 条 件 变量 是 动态 分 配 的 ， 则 需要 使 用 pthread_cond_init 函数 对 它 进行 初始 化 。 

在 释放 条 件 变 量 底层 的 内 存 空间 之 前 , 可 以 使 用 pthread_cond_destroy 函数 对 条 件 变量 
进行 反 初始 化 (deinitialize)。 


#include <pthread.h> 








int pthread cond init (pthread cond t *restrict cond, 


const pthread condattr t *restrict attr); 
int pthread cond destroy (pthread cond t *cond) ; 
两 个 函数 的 返回 值 : 若 成 功 ， 返 回 0， 和 否则， 返回 错误 编号 
除非 需要 创建 一 个 具有 非 默认 属性 的 条 件 变量 , 否则 pthread_cond_init 函数 的 attr 参数 
可 以 设置 为 NULL。 我 们 将 在 12.4.3 节 中 讨论 条 件 变量 属性 。 
我 们 使 用 Pthread_cond_wait 等 待 条 件 变 量变 为 真 。 如 果 在 给 定 的 时 间 内 条 件 不 能 满足 ， 
那么 会 生成 一 个 返回 错误 码 的 变量 。 


#include <pthread.h> 











int pthread cond wait (pthread cond t *restrict cond, 
pthread_mutex_t *restrict mutex) ; 


int pthread_cond_timedwait (pthread_cond_t *restrict cond, 
pthread_mutex_t *restrict mutex, 
const struct timespec *restrict fsptr) ; 


两 个 函数 的 返回 值 ， 若 成 功 ， 返 回 0;， 否 则 ， 返 回 错误 编号 





传递 给 pthread_cond_wait 的 互 斥 量 对 条 件 进 行 保 护 。 调 用 者 把 锁 住 的 互 斥 量 传 给 函数 ， 
函数 然后 自动 把 调用 线程 放 到 等 竺 条件 的 线程 列表 上 ， 对 互 斥 量 解锁 。 这 就 关闭 了 条 件 检 查 和 线 
程 进 入 休眠 状态 等 竺 条件 改变 这 两 个 操作 之 间 的 时 间 通 道 ， 这 样 线程 就 不 会 错过 条 件 的 任何 变 
1. pthread_cond_wait 返回 时 ， 互 斥 量 再 次 被 锁 住 。 

pthread cond timedwait 函数 的 功能 与 pthread_cond wait 函数 相似 ， 只 是 多 了 一 
个 超时 (tsptr)。 超 时 值 指 定 了 我 们 愿意 等 待 多 长 时 间 ， 它 是 通过 timespec 结构 指定 的 。 

如 图 11-13 所 示 ， 需 要 指定 愿意 等 待 多 长 时 间 ， 这 个 时 间 值 是 一 个 绝对 数 而 不 是 相对 数 。 例 
jl. 假设 愿意 等 待 3 分 钟 。 那 么 ， 并 不 是 把 3 分 钟 转换 成 timespec 结构 ， 而 是 需要 把 当前 时 间 
加 上 3 分钟 再 转换 成 timespec 结构 。 

可 以 使 用 clock gettime PE (J 6.10 节 ) 获取 timespec 结构 表示 的 当前 时 间 。 但 是 
目前 并 不 是 所 有 的 平台 都 支持 这 个 函数 ， 因 此 ， 也 可 以 用 另 一 个 函数 gettimeofday 获取 
timeval 结构 表示 的 当前 时 间 ， 然 后 把 这 个 时 间 转 换 成 timespec 结构 。 要 得 到 超时 值 的 绝对 
时 间 ， 可 以 使 用 下 面 的 函数 〈 假 设 阻塞 的 最 大 时 间 使 用 分 来 表示 的 ): 


#include <sys/time.h> 
#include <stdlib.h> 


void 
maketimeout (struct timespec *tsp, long minutes) 


{ 
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struct timeval now; 


/* get the current time */ 

gettimeofday(&now, NULL); 

tsp-»tv sec = now.tv sec; 

tsp->tv_nsec = now.tv usec * 1000; /* usec to nsec */ 
/* add the offset to get timeout value */ 

tsp-»5tv sec += minutes * 60; 


} 
如 果 超 时 到 期 时 条 件 还 是 没有 出 现 ，pPthread_cond timewait 将 重新 获取 互 斥 量 ， 然 后 


返回 错误 ETIMEDOUT。 从 pthread_cond_wait 或 者 pthread cond timedwait 调用 成 功 
返回 时 ， 线 程 需要 重新 计算 条 件 ， 因 为 另 一 个 线程 可 能 已 经 在 运行 并 改变 了 条 件 。 


有 两 个 函数 可 以 用 于 通知 线程 条 件 已 经 满足 pthread_cond_signal 函数 至 少 能 唤醒 一 个 


等 待 该 条 件 的 线程 ， 而 pthread_cond broadcast 函数 则 能 唤醒 等 待 该 条 件 的 所 有 线程 。 


POSIX 规范 为 了 简化 pthread cond signal 的 实现 ， 允 许 它 在 实现 的 时 候 唤醒 一 个 以 上 
的 线程 。 


#include <pthread.h> 


int pthread cond signal(pthread cond t *cond) ; 


int pthread cond broadcast (pthread cond t *cond); 


两 个 函数 的 返回 值 : 若 成 功 ， 返 回 0， 否 则 ， 返 回 错误 编号 





在 调用 pthread_cond_signal R# pthread cond broadcast Hj, 我 们 说 这 是 在 给 线 


程 或 者 条 件 发 信号 。 必 须 注意 ， 一 定 要 在 改变 条 件 状 态 以 后 再 给 线程 发 信号 。 


时 实例 


图 11-15 给 出 了 如 何 结合 使 用 条 件 变量 和 互 斥 量 对 线程 进行 同步 。 


#include <pthread.h> 


struct msg { 


} . 


struct msg *m_next; 
/* ... more stuff here ... */ 


7 


struct msg *workq; 


pthread cond t qready 


pthread mutex t qlock 


PTHREAD COND INITIALIZER; 


ll 


PTHREAD MUTEX INITIALIZER; 


void 


process msg(void) 


( 


struct msg *mp; 


for (;;) { 
pthread mutex lock(&qlock); 
while (workq -- NULL) 
pthread cond wait(&qready, &qlock); 
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mp = workq; 

workq = mp->m_next; 
pthread_mutex_unlock (&qlock) ; 

/* now process the message mp */ 


) 


void 

enqueue msg(struct msg *mp) 

{ 
pthread mutex lock(&qlock); 
mp-»m next = workq; 
workq - mp; 
pthread mutex unlock(&qlock); 
pthread cond signal (&qready) ; 





图 11-15 ”使 用 条 件 变量 
条 件 是 工作 队列 的 状态 。 我 们 用 互 斥 量 保护 条 件 ， 在 while 循环 中 判断 条 件 。 把 消息 放 到 
工作 队列 时 ， 需 要 占有 互 斥 量 ， 但 在 给 等 待 线程 发 信号 时 ， 不 需要 占有 互 斥 量 。 只 要 线程 在 调用 
pthread cond signal 之 前 把 消息 从 队列 中 拖 出 了 ， 就 可 以 在 释放 互 斥 量 以 后 完成 这 部 分 工作 。 
因为 我 们 是 在 while 循环 中 检查 条 件 ， 所 以 不 存在 这 样 的 问题 : 线程 醒 来 ， 发 现 队列 仍 为 空 ， 然 
后 返回 继续 等 待 。 如 果 代 码 不 能 容忍 这 种 竞争 ， 就 需要 在 给 线程 发 信号 的 时 候 占有 互 斥 量 。 a 


11.6.7 Abe i 


自 旋 锁 与 互 斥 量 类 似 ， 但 它 不 是 通过 休眠 使 进程 阻塞 ， 而 是 在 获取 锁 之 前 一 直 处 于 忙 等 〈 自 
We) 阻塞 状态 。 自 旋 锁 可 用 于 以 下 情况 : 锁 被 持 有 的 时 间 短 ， 而 且 线 程 并 不 希望 在 重新 调度 上 花 
费 太 多 的 成 本 。 

自 旋 锁 通 常 作为 底层 原 语 用 于 实现 其 他 类 型 的 锁 。 根 据 它们 所 基于 的 系统 体系 结构 ， 可 以 通 
过 使 用 测试 并 设置 指令 有 效 地 实现 。 当 然 这 里 说 的 有 效 也 还 是 会 导致 CPU 资源 的 浪费 : 当 线 程 自 
旋 等 待 锁 变 为 可 用 时 ，CPU 不 能 做 其 他 的 事情 。 这 也 是 自 旋 锁 只 能 够 被 持 有 一 小 段 时 间 的 原因 。 

当 自 旋 锁 用 在 非 抢占 式 内 核 中 时 是 非常 有 用 的 : 除了 提供 互 斥 机 制 以 外 ， 它 们 会 阻塞 中 断 ， 
这 样 中 断 处 理 程 序 就 不 会 让 系统 陷入 死 锁 状态 ， 因 为 它 需要 获取 已 被 加 锁 的 自 旋 锁 〈 把 中 断想 成 
是 另 一 种 抢占 )。 在 这 种 类 型 的 内 核 中 ， 中 断 处 理 程 序 不 能 休眠 ， 因 此 它们 能 用 的 同步 原 语 只 能 
是 自 旋 锁 。 

但 是 ， 在 用 户 层 ， 自 旋 锁 并 不 是 非常 有 用 ， 除 非 运行 在 不 允许 抢占 的 实时 调度 类 中 。 运 行 在 
分 时 调度 类 中 的 用 户 层 线程 在 两 种 情况 下 可 以 被 取消 调度 : 当 它 们 的 时 间 片 到 期 时 ， 或 者 具有 更 
高 调度 优先 级 的 线程 就 绪 变 成 可 运行 时 。 在 这 些 情况 下 ， 如 果 线 程 拥有 自 旋 锁 ， 它 就 会 进入 休眠 
状态 ， 阻 塞 在 锁 上 的 其 他 线程 自 旋 的 时 间 可 能 会 比 预期 的 时 间 更 长 。 

很 多 互 斥 量 的 实现 非常 高 效 ， 以 至 于 应 用 程序 采用 互 斥 锁 的 性 能 与 曾经 采用 过 自 旋 锁 的 性 能 
基本 是 相同 的 。 事 实 上 ， 有 些 互 斥 量 的 实现 在 试图 获取 互 斥 量 的 时 候 会 自 旋 一 小 段 时 间 ， 只 有 在 
自 旋 计数 到 达 某 一 阀 值 的 时 候 才 会 休眠 。 这 些 因素 ， 加 上 现代 处 理 器 的 进步 ， 使 得 上 下 文 切换 越 
来 越 快 ， 也 使 得 自 旋 锁 只 在 某 些 特定 的 情况 下 有 用 。 

自 旋 锁 的 接口 与 互 斥 量 的 接口 类 似 ， 这 使 得 它 可 以 比较 容易 地 从 一 个 替换 为 另 一 个 。 可 以 用 
pthread spin init 函数 对 自 旋 锁 进行 初始 化 。 用 pthread spin destroy 函数 进行 自 旋 
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锁 的 反 初始 化 。 


#include <pthread.h> 


int pthread_spin_init (pthread_spinlock_t *lock, int pshared) ; 


int pthread spin destroy(pthread spinlock t *lock) ; 
两 个 函数 的 返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


只 有 一 个 属性 是 自 旋 锁 特 有 的 ， 这 个 属性 只 在 支持 线程 进程 共享 同步 (Thread Process-Shared 
Synchronization) 选项 (这 个 选项 目前 在 Single UNIX Specification 中 是 强制 的 ， 见 图 2-5) 的 平台 
上 才 用 得 到 。pshared 参数 表示 进程 共享 属性 ， 表 明 自 旋 锁 是 如 何 获取 的 。 如 果 它 设 为 PTHREAD_ 
PROCESS_SHARED， 则 自 旋 锁 能 被 可 以 访问 锁 底 层 内 存 的 线程 所 获取 ， 即 便 那 些 线程 属于 不 同 的 
进程 ， 情 况 也 是 如 此 。 否 则 pshared 参数 设 为 PTHREAD PROCESS PRIVATE, A heim HER 

初始 化 该 锁 的 进程 内 部 的 线程 所 访问 。 

可 以 用 pthread spin lock 或 pthread spin trylock 对 自 旋 锁 进行 加 锁 , 前 者 在 获取 锁 
之 前 一 直 自 旋 ， 后 者 如 果 不 能 获取 锁 ， 就 立即 返回 EBUSY 错误 。 注 意 ，pthread spin trylock 
不 能 自 旋 。 不 管 以 何 种 方式 加 锁 ， 自 旋 锁 都 可 以 调用 pthread_spin_unlock 函数 解锁 。 


#include «pthread.h» 





int pthread spin lock(pthread spinlock t *lock) ; 


int pthread spin trylock(pthread spinlock t *lock) ; 


int pthread spin unlock(pthread spinlock t *lock) ; 


所 有 函数 的 返回 值 : 若 成 功 ， 返 回 0;， 否则 ， 返 回 错误 编号 





注意 ， 如 果 自 旋 锁 当前 在 解锁 状态 的 话 ，pthread_spin_lock 函数 不 要 自 旋 就 可 以 对 它 加 
锁 。 如 果 线 程 已 经 对 它 加 锁 了 , 结果 就 是 未 定义 的 。 调用 pthread_spin_lock 会 返回 EDEADLK 
错误 (或 其 他 错误 )， 或 者 调用 可 能 会 永久 自 旋 。 具 体 行为 依赖 于 实际 的 实现 。 试 图 对 没有 加 锁 
的 自 旋 锁 进行 解锁 ， 结 果 也 是 未 定义 的 。 

不 管 是 pthread_spin_lock 还 是 pthread spin trylock， 返 回 值 为 0 的 话 就 表示 自 
旋 锁 被 加 锁 。 需 要 注意 ， 不 要 调用 在 持 有 自 旋 锁 情 况 下 可 能 会 进入 休 眼 状态 的 函数 。 如 果 调 用 了 
这 些 函 数 ， 会 浪费 CPU 资源 ， 因 为 其 他 线程 需要 获取 自 旋 锁 需要 等 待 的 时 间 就 延长 了 。 


11.6.8 ”屏障 


屏障 Cbarrier) 是 用 户 协调 多 个 线程 并 行 工作 的 同步 机 制 。 屏障 允许 每 个 线程 等 待 ， 直 到 所 
有 的 合作 线程 都 到 达 某 一 点 ,然后 从 该 点 继续 执行 。 我 们 已 经 看 到 一 种 屏障 ,pthread join FÉ 
数 就 是 一 种 屏障 ， 允 许 一 个 线程 等 待 ， 直 到 另 一 个 线程 退出 。 

但 是 屏障 对 象 的 概念 更 广 ， 它 们 允许 任意 数量 的 线程 等 待 ， 直 到 所 有 的 线程 完成 处 理工 作 ， 
而 线程 不 需要 退出 。 所 有 线程 达到 屏障 后 可 以 接着 工作 。 

可 以 使 用 pthread barrier init 函数 对 屏障 进行 初始 化 ， 用 thread barrier destroy 
函数 反 初始 化 。 





#include <pthread.h> 


int pthread barrier init(pthread barrier t *restrict barrier, 
const pthread barrierattr t *restrict attr, 
unsigned int count); 
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int pthread barrier destroy(pthread barrier t *barrier) ; 


两 个 函数 的 返回 值 : 若 成 功 ， 返 回 0， 和 否则 ， 返 回 错误 编号 





初始 化 屏障 时 ， 可 以 使 用 count 参数 指定 ， 在 允许 所 有 线程 继续 运行 之 前 ， 必 须 到 达 屏 障 的 
线程 数目 。 使 用 attr 参数 指定 屏障 对 象 的 属性 , 我 们 会 在 下 一 章 详 细 讨论 。 现 在 设置 attr 为 NULL, 
用 默认 属性 初始 化 屏障 。 如 果 使 用 pthread barrier init 函数 为 屏障 分 配 资 源 ， 那 么 在 反 初 
始 化 屏障 时 可 以 调用 pthread barrier_destroy 函数 释放 相应 的 资源 。 

可 以 使 用 pthread barrier wait 函数 来 表明 , 线程 已 完成 工作 , 准备 等 所 有 其 他 线程 赶 上 来 。 


#include <pthread.h> 


int pthread barrier wait(pthread barrier t *barrier) ; 


返回 值 : 若 成 功 ， 返 回 0 或 者 PTHREAD BARRIER SERIAL THREAD; 否则 ， 返 回 错误 编号 





调用 pthread barrier wait 的 线程 在 屏障 计数 (调用 pthread barrier init 时 设 
定 ) 未 满足 条 件 时 , 会 进入 休眠 状 态 。 如 果 该 线程 是 最 后 一 个 调用 pthread barrier wait 的 
线程 ， 就 满足 了 屏障 计数 ， 所 有 的 线程 都 被 唤醒 。 

对 于 一 个 任意 线程 ，pthread_barrier wait 函数 返回 了 PTHREAD BARRIER SERIAL. 
THRERAD。 剩 下 的 线程 看 到 的 返回 值 是 0。 这 使 得 一 个 线程 可 以 作为 主线 程 ， 它 可 以 工作 在 其 他 所 
有 线程 已 完成 的 工作 结果 上 。 

一 旦 达到 屏障 计数 值 ， 而 且 线 程 处 于 非 阻塞 状 态 ， 屏 障 就 可 以 被 重用 。 但 是 除非 在 调用 了 
pthread barrier destroy 函数 之 后 , 义 调用 了 pthread barrier init 函数 对 计数 用 另 
外 的 数 进行 初始 化 ， 否 则 屏障 计数 不 会 改变 。 


得 实例 
图 11-16 给 出 了 在 一 个 任务 上 合作 的 多 个 线程 之 间 如 何 用 屏障 进行 同步 。 


#include "apue.h" 
#include <pthread.h> 
#include <limits.h> 
#include <sys/time.h> 


#define NTHR 8 /* number of threads */ 
#define NUMNUM 8000000L /* number of numbers to sort */ 
#define TNUM (NUMNUM/NTHR) /* number to sort per thread */ 


long nums [NUMNUM] ; 
long snums [NUMNUM] ; 


pthread_barrier_t b; 


#ifdef SOLARIS 
#define heapsort qsort 
#else 
extern int heapsort (void *, size t, size t, 
int (*)(const void *, const void *)); 
#endif 


/* 
* Compare two long integers (helper function for heapsort) 
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int 


complong(const void *argl, 


{ 


/* 
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long 11 = *(long *) 

long 12 = *(long *) 

if (11 == 12) 
return 0; 


else if (11 < 12) 
return -1; 
else 
return 1; 


argl; 
arg2; 


const void *arg2) 


* Worker thread to sort a portion of the set of numbers. 


x 


void 


* 


thr fn(void *arg) 


( 


long idx = (long 


heapsort (&nums [idx] 
pthread_barrier_wai 


/* 


)arg; 


, TNUM, sizeof(long), complong) ; 


t(&b); 


* Go off and perform more work ... 


Ld 
return((void *)0); 


* Merge the results of the individual sorted ranges. 


/* 

tA 

void 

merge () 

{ 
long idx[NTHR]; 
long i, minidx, 


sidx, num; 


for (i = 0; i < NTHR; i++) 


idx[i] =i*T 


NUM; 


for (sidx = 0; sidx < NUMNUM; sidx++) 


num = LONG MAX 
for (i = 0; i 


F 


< NTHR; i++) { 


if ((idx[i] < (i*1)*TNUM) && 


num = 


nums [idx[i]];7 


minidx = i; 


} 
snums[sidx] = 
idx [minidx]++; 


nums [idx [minidx] ]; 


{ 


(nums[idx[i]] < num) ) 


{ 
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int 


main () 


{ 


屏障 计数 值 设 为 工作 线程 数 加 1 的 原因 ， 主 线程 也 作为 其 中 的 一 个 候选 线程 。 


unsigned long i; 

struct timeval start, end; 

long long startusec, endusec; 
double elapsed; 

int err; 

pthread_t tid; 

/* 


* Create the initial set of numbers to sort. 


ef 

srandom (1); 

for (i = 0; i < NUMNUM; i++) 
nums[i] = random(); 


/* 

* Create 8 threads to sort the numbers. 

x4 

gettimeofday(&start, NULL); 

pthread barrier init(&b, NULL, NTHR+1); 

for (i = 0; i « NTHR; i++) { 
err = pthread_create(&tid, NULL, thr_fn, 
if (err != 0) 


err exit(err, "can't create thread"); 


} 

pthread barrier wait(&b); 
merge(); 
gettimeofday(&end, NULL); 


/* 
* Print the sorted list. 
Ey 


(void *) (i * TNUM)); 


startusec = start.tv_sec * 1000000 + start.tv_usec; 


endusec = end.tv_sec * 1000000 + end.tv_usec; 


elapsed = (double) (endusec - startusec) / 1000000.0; 


printf ("sort took $.4f seconds\n", elapsed); 
for (i = 0; i < NUMNUM; i++) 

printf ("%ld\n", snums[i]); 
exit (0); 


图 11-16 ”使 用 屏障 
这 个 例子 给 出 了 多 个 线程 只 执行 一 个 任务 时 ， 使 用 屏障 的 简单 情况 。 在 更 加 实际 的 情况 下 ， 
工作 线程 在 调用 pthread barrier wait 函数 返回 后 会 接着 执行 其 他 的 活动 。 
在 这 个 实例 中 ， 使 用 8 个 线程 分 解 了 800 万 个 数 的 排序 工作 。 每 个 线程 用 堆 排 序 算法 对 100 
万 个 数 进行 排序 (详细 算法 请 参阅 Knuth[1998])。 然后 主线 程 调用 一 个 函数 对 这 些 结果 进行 合并 。 
并 不 需要 使 用 pthread barrier wait 函数 中 的 返回 值 PTHREAD_BARRIER_SERIAL_ 
THREAD 来 决定 哪个 线程 执行 结果 合并 操作 ， 因 为 我 们 使 用 了 主线 程 来 完成 这 个 任务 。 这 也 是 把 
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如 果 只 用 一 个 线程 去 完成 800 万 个 数 的 堆 排序 ， 那 么 与 图 11-16 中 的 程序 相 比 ， 我 们 将 能 看 
到 图 11-16 中 的 程序 在 性 能 上 有 显著 提升 。 在 8 核 处 理 器 系统 上 ， 单 线程 程序 对 800 万 个 数 进行 
排序 需要 12.14 秒 。 同 样 的 系统 ， 使 用 8 个 并 行 线程 和 1 个 合并 结果 的 线程 ， 相 同 的 800 万 个 数 
的 排序 仅 需要 1.91 秒 ， 速 度 提 升 了 6 fi. m 


11.7 小结 


本 章 介绍 了 线程 的 概念 ， 讨 论 了 现 有 的 创建 和 销毁 线程 的 POSIX.1 原 语 ; 此 外 ， 还 介绍 了 线 
程 同步 问题 ， 讨 论 了 5 个 基本 的 同步 机 制 〈 互 斥 量 、 读 写 锁 、 条 件 变量 、 自 旋 锁 以 及 屏障 )， 了 
解 了 如 何 使 用 它们 来 保护 共享 资源 。 


习题 


11.1 修改 图 11-4 所 示 的 实例 代码 ， 正 确 地 在 两 个 线程 之 间 传 递 结构 。 

11.2 在 图 11-14 所 示 的 实例 代码 中 ， 需 要 另外 添加 什么 同步 《如 果 需 要 的 话 ) 可 以 使 得 主线 程 改 
变 与 挂 起 作业 关联 的 线程 ID? 这 会 对 job_remove 函数 产生 什么 影响 ? 

11.3 把 图 11-15 中 的 技术 运用 到 工作 线程 实例 (图 11-1 和 图 11-14) 中 实现 工作 线程 函数 。 不 要 
忘记 更 新 queue init 函数 对 条 件 变量 进行 初始 化 ， 修 改 job insert 和 job append 
函数 给 工作 线程 发 信号 。 会 出 现 什么 样 的 困难 ? 

11.4 下 面 哪个 步骤 序列 是 正确 的 ? 

(D 对 互 斥 量 加 锁 (pthread mutex lock). 
(2) 改变 互 斥 量 保护 的 条 件 。 
(3) 给 等 待 条 件 的 线程 发 信号 (pthread_cond_broadcast). 
422 (4) 对 互 斥 量 解锁 (pthread mutex unlock). 
或 者 
CD 对 互 斥 量 加 锁 Cpthread_mutex_lock). 
(2) 改变 互 斥 量 保 护 的 条 件 。 
(3) 对 互 斥 量 解锁 (pthread mutex_unlock)。 
(4) 给 等 待 条 件 的 线程 发 信号 (pthread cond broadcast). 
11.5 实现 屏障 需要 什么 同步 原 语 ? 给 出 pthread_barrier_wait 函数 的 一 个 实现 。 
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12.1 引言 


第 11 章 讲 了 线程 以 及 线程 同步 的 基础 知识 。 本 章 将 讲解 控制 线程 行为 方面 的 详细 内 容 ， 介 
绍 线程 属性 和 同步 原 语 属性 。 前 面 的 章节 中 使 用 的 都 它们 的 默认 行为 ， 没 有 进行 详细 介绍 。 

接 下 来 还 将 介绍 同一 进程 中 的 多 个 线程 之 间 如 何 保持 数据 的 私有 性 。 最 后 讨论 基于 进程 的 系 
统 调用 如 何 与 线程 进行 交互 。 


12.2 线程 限制 


在 2.5.4 节 中 讨论 了 sysconf 函数 。 Single UNIX Specification 定义 了 与 线程 操作 有 关 的 一 些 
限制 ， 图 2-11 并 没有 列 出 这 些 限制 。 与 其 他 的 系统 限制 一 样 ， 这 些 限制 也 可 以 通过 sysconf PR 


数 进 行 查询 。 图 12-1 总 结 了 这 些 限制 。 
_SC_THREAD_DESTRUCTOR_ 


PTHREAD_DESTRUCTOR_ 线程 退出 时 操作 系统 实现 试图 销毁 线程 特 
ITERATIONS 定数 据 的 最 大 次 数 〈 见 12.6 节 ) ITERRTIONS 
PTHREAD_KEYS_MAX 进程 可 以 创建 的 键 的 最 大 数目 〈 见 12.6 节 ) _SC_THREAD_KEYS MAX 
PTHREAD_STACK MIN 一 个 线程 的 栈 可 用 的 最 小 字 节 数 CL 12.3 1$) | SC THREAD STACK MIN 
PTHREAD_THREADS_MAX 进程 可 以 创建 的 最 大 线程 数 ( 见 12.3 节 ) _SC_THREAD_THREADS_ MAX 
图 12-1 ”线程 限制 和 sysconf 的 name BR 

与 sysconf 报告 的 其 他 限制 一 样 ， 这 些 限制 的 使 用 是 为 了 增强 应 用 程序 在 不 同 的 操作 系统 
实现 之 间 的 可 移植 性 。 例 如 ， 如 果 应 用 程序 需要 为 它 管理 的 每 个 文件 创建 4 个 线程 ， 但 是 系统 却 
并 不 允许 创建 所 有 这 些 线程 ， 这 时 可 能 就 必须 限制 当前 可 并 发 管理 的 文件 数 。 

图 12-2 给 出 了 本 书 描述 的 4 种 操作 系统 实现 中 线程 限制 的 值 。 如 果 操作 系统 实现 的 限制 是 不 
确定 的 ， 列 出 的 值 就 是 “没有 确定 的 限制 ”(no limit)。 但 这 并 不 意味 着 值 是 无 限制 的 。 


限制 名 称 FreeBSD 8.0 Linux 3.2.0 Mac OS X 10.6.8 Solaris 10 











































PTHREAD_DESTRUCTOR_ITERATIONS 4 4 4 | 没有 确定 的 限制 


PTHREAD_KEYS_MAX 256 1 024 512 | 没有 确定 的 限制 
PTHREAD STACK MIN 2 048 16 384 8 192 8192 
PTHREAD THREADS MAX 没有 确定 的 限制 | 没有 确定 的 限制 | 没有 确定 的 限制 | 没有 确定 的 限制 





图 12-2 ”线程 配置 限制 的 实例 
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注意 ， 虽 然 某 个 操作 系统 实现 可 能 没有 提供 访问 这 些 限制 的 方法 ， 但 这 并 不 意味 着 这 些 限 制 
不 存在 ， 这 只 是 意味 着 操作 系统 实现 没有 为 使 用 sysconf 访问 这 些 值 提供 可 用 的 方法 。 


12.3 ”线程 属性 


pthread 接口 允许 我 们 通过 设置 每 个 对 和 象 关联 的 不 同属 性 来 细 调 线程 和 同步 对 象 的 行为 。 通 
常 ， 管 理 这 些 属性 的 函数 都 遵循 相同 的 模式 。 

OD 每 个 对 象 与 它 自己 类 型 的 属性 对 象 进行 关联 线程 与 线程 属性 关联 ， 互 斥 量 与 互 斥 量 属 
性 关联 ， 等 等 )。 一 个 属性 对 象 可 以 代表 多 个 属性 。 属 性 对 象 对 应 用 程序 来 说 是 不 透明 的 。 这 意 
味 着 应 用 程序 并 不 需要 了 解 有 关 属 性 对 象 内 部 结构 的 详细 细节 ， 这 样 可 以 增强 应 用 程序 的 可 移植 


性 。 取 而 代 之 的 是 ， 需 要 提供 相应 的 函数 来 管理 这 些 属性 对 象 。 


(2) 有 一 个 初始 化 函数 ， 把 属性 设置 为 默认 值 。 

(3) 还 有 一 个 销毁 属性 对 象 的 函数 。 如 果 初 始 化 函数 分 配 了 与 属性 对 象 关联 的 资源 ， 销 毁 函 
数 负责 释放 这 些 资源 。 

(4) 每 个 属性 都 有 一 个 从 属性 对 象 中 获取 属性 值 的 函数 。 由 于 函数 成 功 时 会 返回 0， 失 败 时 会 返回 
错误 编号 ， 所 以 可 以 通过 把 属性 值 存 储 在 函数 的 某 一 个 参数 指定 的 内 存单 元 中 , 把 属性 值 返 回 给 调用 者 。 
(5) 每 个 属性 都 有 一 个 设置 属性 值 的 函数 。 在 这 种 情况 下 ， 属 性 值 作为 参数 按 值 传递 。 

在 第 11 章 所 有 调用 pthread create 函数 的 实例 中 , 传 入 的 参数 都 是 空 指针 ， 而 不 是 指向 
pthread attr t 结构 的 指针 。 可 以 使 用 pthread_attr_t 结构 修改 线程 默认 属性 ， 并 把 这 些 
属性 与 创建 的 线程 联系 起 来 。 可 以 使 用 pthread_attr_init 函数 初始 化 pthread attr t # 
构 。 在 调用 pthread attr init UJA, pthread attr tt 结构 所 包含 的 就 是 操作 系统 实现 支 
持 的 所 有 线程 属性 的 默认 值 。 


#include <pthread.h> 





int pthread attr init(pthread attr t *attr); 


int pthread attr destroy(pthread attr t *attr); 


POS PRAIRIE: FRH, BE 0; 否则 ， 返 回 错误 编号 


如 果 要 反 初始 化 pthread_attr_t 结构， 可 以 调用 pthread_attr_destroy MAM. mR 
pthread attr init 的 实现 对 属性 对 象 的 内 存 空间 是 动态 分 配 的 , pthread_attr_destroy 
就 会 释放 该 内 存 空间 。 除 此 之 外 ，pthread_attr_destroy 还 会 用 无 效 的 值 初始 化 属性 对 象 ， 
因此 ， 如 果 该 属性 对 象 被 误 用 ， 将 会 导致 pthread_create 函数 返回 错误 码 。 

图 12-3 总 结 了 POSIX.1 定义 的 线程 属性 。POSIX.1 还 为 线程 执行 调度 (Thread Execution 
Scheduling) 选项 定义 了 额外 的 属性 ， 用 以 支持 实时 应 用 ， 但 我 们 并 不 打算 在 这 里 讨论 这 些 属性 。 
图 12-3 同时 给 出 了 各 个 操作 系统 平台 对 每 个 线程 属性 的 支持 情况 。 








detachstate 线程 的 分 离 状态 属性 


guardsize | 线程 栈 未 尾 的 警戒 缓冲 区 大 小 〈 字 节 数 ) 
stackaddr 线程 栈 的 最 低地 址 
stacksize 线程 栈 的 最 小 长 度 〈 字 节 数 ) 


图 12-3 POSIX.1 线程 属性 
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11.5 节 介绍 了 分 离线 程 的 概念 。 如 果 对 现 有 的 某 个 线程 的 终止 状态 不 感 兴趣 的 话 ， 可 以 使 用 
pthread detach 函数 让 操作 系统 在 线程 退出 时 收回 它 所 占用 的 资源 。 [427] 
如 果 在 创建 线程 时 就 知道 不 需要 了 解 线程 的 终止 状态 ， 就 可 以 修改 pthread attr t 结构 中 的 
detachstate 线程 属性 ， 让 线程 一 开始 就 处 于 分 离 状 态 。 可 以 使 用 pthread attr setdetachstate 
函数 把 线程 属性 detachstate 设置 成 以 下 两 个 合法 值 之 一 : PTHREAD_CREATE_DETACHED， 以 分 离 状态 
启动 线程 ;或 者 PTHREAD CREATE JOINABLIE， 正 常 启动 线程 ， 应 用 程序 可 以 获取 线程 的 终止 状态 。 


#include <pthread.h> 


int pthread attr getdetachstate(const pthread attr t *restrict attr, 
int *detachstate) ; 


int pthread attr setdetachstate(pthread attr t *attr, int *detachstate) ; 


两 个 函数 的 返回 值 : 车 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 





可 以 调用 pthread attr_getdetachstate 函数 获取 当前 的 detachstate 线程 属性 。 第 二 个 参 
数 所 指向 的 整数 要 么 设置 成 PTHREAD CREATE_DETACHED， 要 么 设置 成 PTHREAD CREATE 
JOINABLE， 具 体 要 取决 于 给 定 pthread_attrt 结构 中 的 属性 值 。 


s Bl 
图 12-4 给 出 了 一 个 以 分 离 状态 创建 线程 的 函数 。 


#include "apue.h" 
#include <pthread.h> 


int 
makethread (void *(*fn) (void *), void *arg) 
{ 


int err; 
pthread_t tid; 
pthread_attr_t attr; 


err = pthread attr init(&attr); 
if (err != 0) 
return (err); 
err = pthread_attr_setdetachstate(&attr, PTHREAD_CREATE_DETACHED) ; 
if (err == 0) 
err = pthread_create(&tid, &attr, fn, arg); 
pthread attr destroy(&attr); 
return(err); 


12-4 ”以 分 离 状态 创建 线程 

注意 ， 此 例 忽 略 了 pthread_attr_destroy 函数 调用 的 返回 值 。 在 这 个 实例 中 ， 我 们 对 线 
程 属性 进行 了 合理 的 初始 化 ， 因 此 pthread attr destroy 应 该 不 会 失败 。 但 是 ， 如 果 
pthread attr destroy 确实 出 现 了 失败 的 情况 ， 将 难以 清理 : 必须 销毁 刚刚 创建 的 线程 ， 也 
许 这 个 线程 可 能 已 经 运行 ， 并 且 与 pthread attr destroy 函数 可 能 是 异步 执行 的 。 忽 略 
pthread attr destroy 的 错误 返回 可 能 出 现 的 最 坏 情 况 是 ， 如 果 pthread attr init 已 
经 分 配 了 内 存 空间 ， 就 会 有 少量 的 内 存 汇 漏 。 另 一 方面 ， 如 果 pthread attr init 成 功 地 对 
线程 属性 进行 了 初始 化 , 但 之 后 pthread attr destroy 的 清理 工作 失败 ， 那 么 将 没有 任何 补 
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救 策 略 ， 因 为 线程 属性 结构 对 应 用 程序 来 说 是 不 透明 的 ， 可 以 对 线程 属性 结构 进行 清理 的 唯一 接 
口 是 pthread_attr_destroy， 但 它 失败 了 。 m 

对 于 遵循 POSIX 标准 的 操作 系统 来 说 ,并 不 一 定 要 支持 线程 栈 属性 , 但 是 对 于 遵循 Single UNIX 
Specification 中 XSI 选项 的 系统 来 说 ， 支 持 线程 栈 属 性 就 是 必需 的 。 可 以 在 编译 阶段 使 用 POSIX. 
THREAD ATTR STACKADDR fll POSIX THREAD ATTR STACKSIZE 符号 来 检查 系统 是 否 支持 每 一 
个 线程 栈 属性 。 如 果 系 统 定义 了 这 些 符号 中 的 一 个 ， 就 说 明 它 支持 相应 的 线程 栈 属性 。 或者， 也 可 以 
在 运行 阶段 把 _sC_THREAD ATTR STACKADDR 和 _SC_THREAD ATTR STACKSIZE BAER 
sysconf 函数 ， 检 查 运 行 时 系统 对 线程 栈 属性 的 支持 情况 。 

可 以 使 用 函数 pthread attr getstack 和 pthread attr_setstack 对 线程 栈 属性 进 
行 管 理 。 


#include <pthread.h> 





int pthread_attr_getstack(const pthread_attr_t *restrict attr, 
void **restrict stackaddr, 
size t *restrict stacksize) ; 


int pthread attr setstack(pthread attr t *attr, 
void *stackaddr, size t stacksize) ; 


两 个 函数 的 返回 值 : FRH, JRO; 否则 ， 返 回 错误 编号 


对 于 进程 来 说 ， 虚 地 址 空间 的 大 小 是 固定 的 。 因 为 进程 中 只 有 一 个 栈 ， 所 以 它 的 大 小 通常 不 
是 问题 。 但 对 于 线程 来 说 ， 同 样 大 小 的 虚 地 址 空间 必须 被 所 有 的 线程 栈 共 享 。 如 果 应 用 程序 使 用 
了 许多 线程 ， 以 致 这 些 线程 栈 的 累计 大 小 超过 了 可 用 的 虚 地 址 空间 ， 就 需要 减少 默认 的 线程 栈 大 
小 。 男 一 方面 ， 如 果 线 程 调用 的 函数 分 配 了 大 量 的 自动 变量 ,或 者 调用 的 函数 涉及 许多 很 深 的 栈 
bi (stack frame)， 那 么 需要 的 栈 大 小 可 能 要 比 默认 的 大 。 

如 果 线 程 栈 的 虚 地 址 空间 都 用 完了 ， 那 可 以 使 用 malloc 或 者 mmap CHL 14.8 节 ) RA AH 
代 的 栈 分 配 空间 ， 并 用 pthread_attr_setstack 函数 来 改变 新 建 线程 的 栈 位 置 。 由 stackaddr 
参数 指定 的 地 址 可 以 用 作 线 程 栈 的 内 存 范围 中 的 最 低 可 寻 址 地 址 ， 该 地 址 与 处 理 器 结构 相应 的 边 
界 应 对 齐 。 当 然 ， 这 要 假设 malloc 和 mmap 所 用 的 虚 地 址 范围 与 线程 栈 当 前 使 用 的 虚 地 址 范围 
不 同 。 

stackaddr 线程 属性 被 定义 为 栈 的 最 低 内 存 地 址 ， 但 这 并 不 一 定 是 栈 的 开始 位 置 。 对 于 一 个 给 
定 的 处 理 器 结构 来 说 , 如果 栈 是 从 高 地 址 向 低地 址 方向 增长 的 , 那么 stackaddr 线程 属性 将 是 栈 的 
结尾 位 置 ， 而 不 是 开始 位 置 。 

应 用 程序 也 可 以 通过 pthread attr getstacksize 和 pthread attr setstacksize fü 

数 读 取 或 设置 线程 属性 stacksize。 


#include <pthread.h> 








int pthread_attr_getstacksize(const pthread_attr_t *restrict attr, 
size_t *restrict stacksize) ; 


int pthread attr setstacksize (pthread attr t *attr, size t stacksize) ; 


两 个 函数 的 返回 值 : 若 成 功 ， 返 回 0， 否 则 ， 返 回 错误 编号 





如 果 希 望 改变 默认 的 栈 大 小 , 但 又 不 想 自己 处 理 线程 栈 的 分 配 问 题 ， 这 时 使 用 Pthread_attr_ 
setstacksize 函数 就 非常 有 用 。 设 置 stacksize 属性 时 ， 选 择 的 stacksize 不 能 小 于 PTHREAD_ 
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STACK MIN. 
线程 属性 guardsize 控制 着 线程 栈 末 尾 之 后 用 以 避免 栈 溢出 的 扩展 内 存 的 大 小 。 这 个 属性 默认 
值 是 由 具体 实现 来 定义 的 ， 但 常用 值 是 系统 页 大 小 。 可 以 把 guardsize 线程 属性 设置 为 0， 不 允许 
属性 的 这 种 特征 行为 发 生 : 在 这 种 情况 下 ， 不 会 提供 警戒 缓冲 区 。 同 样 ， 如 果 修 改 了 线程 属性 
stackaddr， 系 统 就 认为 我 们 将 自己 管理 栈 ， 进 而 使 栈 警 戒 缓冲 区 机 制 无 效 ， 这 等 同 于 把 guardsize 
线程 属性 设置 为 0。 
#include <pthread.h> 


iint pthread_attr_getguardsize(const pthread_attr_t *restrict attr, 
size_t *restrict guardsize) ; 


int pthread attr setguardsize(pthread attr t *attr, size_t guardsize) ; 


两 个 函数 的 返回 值 ， 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 








WR guardsize 线程 属性 被 修改 了 , 操作 系统 可 能 会 把 它 取 为 页 大 小 的 整数 倍 。 如 果 线 程 的 栈 
指针 溢出 到 警戒 区 域 ， 应 用 程序 就 可 能 通过 信号 接收 到 出 错 信息 。 

Single UNIX Specification 还 定义 了 一 些 其 他 的 可 选 线程 属性 供 实时 应 用 程序 使 用 ， 但 在 这 里 
不 讨论 这 些 属性 。 

线程 还 有 一 些 其 他 的 pthread_attr_t 结构 中 没有 表示 的 属性 : 可 撤销 状态 和 可 撤销 类 型 。 
我 们 将 在 12.7 节 中 讨论 它们 。 


12.4 同步 属性 


就 像 线 程 具有 属性 一 样 ， 线 程 的 同步 对 象 也 有 属性 。11.6.7 节 中 介绍 了 自 旋 锁 ， 它 有 一 个 属 
性 称 为 进程 共享 属性 。 本 节 讨 论 互 斥 量 属性 、 读 写 锁 属 性 、 条 件 变量 属性 和 屏障 属性 。 


12.4.1 互 斥 量 属性 


互 斥 量 属性 是 用 pthread_mutexattr_t 结构 表示 的 。 第 11 章 中 每 次 对 互 斥 量 进行 初始 化 
时 , 都 是 通过 使 用 PTHREAD_MUTEX_INITIALIZER 常量 或 者 用 指向 互 斥 量 属性 结构 的 空 指针 作 
为 参数 调用 pthread mutex_init 函数 ， 得 到 互 斥 量 的 默认 属性 。 

对 于 非 默认 属性 , 可 以 用 pthread mutexattr init 初始 化 Pthread_mutexattr t %4 
构 ， 用 pthread mutexattr_destroy 来 反 初 始 化 。 


#include <pthread.h> 


int pthread mutexattr init(pthread mutexattr t *attr); 


int pthread mutexattr destroy(pthread mutexattr t *attr); 


两 个 函数 的 返回 值 ， 若 成 功 ， 返 回 0; 否则 ， 返 回 错 误 编号 








pthread mutexattr init 函数 将 用 默认 的 互 斥 量 属性 初始 化 pthread mutexattr t 
结构 。 值 得 注意 的 3 个 属性 是 : 进程 共享 属性 、 健 壮 属性 以 及 类 型 属性 。POSIX.1 中 ， 进 程 共享 
属性 是 可 选 的 。 可 以 通过 检查 系统 中 是 否定 义 了 _POSIX_THREAD_PROCESS_SHARED 符号 来 判 
断 这 个 平台 是 否 支持 进程 共享 这 个 属性 ， 也 可 以 在 运行 时 把 _SC_THREAD_PROCESS_SHARED 参 
数 传 给 sysconf 函数 进行 检查 。 虽 然 这 个 选项 并 不 是 遵循 POSIX 标准 的 操作 系统 必须 提供 的 ， 
但 是 Single UNIX Specification 要 求 遵 循 XSI 标准 的 操作 系统 支持 这 个 选项 。 
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在 进程 中 ， 多 个 线程 可 以 访问 同一 个 同步 对 象 。 正 如 在 第 11 章 中 看 到 的 ， 这 是 默认 的 行为 。 
在 这 种 情况 下 ， 进 程 共享 互 斥 量 属性 需 设置 为 PTHREAD _PROCESS_PRIVATE。 

我 们 将 在 第 14 章 和 第 15 章 中 看 到 ， 存 在 这 样 的 机 制 : 允许 相互 独立 的 多 个 进程 把 同一 个 内 
存 数据 块 映射 到 它们 各 自 独立 的 地 址 空间 中 。 就 像 多 个 线程 访问 共享 数据 一 样 ， 多 个 进程 访问 共 
享 数据 通常 也 需要 同步 。 如 果 进 程 共享 互 斥 量 属性 设置 为 PTHRERAD_PROCESS_SHRARED， 从 多 个 
进程 彼此 之 间 共 享 的 内 存 数 据 块 中 分 配 的 互 斥 量 就 可 以 用 于 这 些 进程 的 同步 。 

可 以 使 用 pthread_mutexattr_getpshared 函数 查询 pthread mutexattr t 结构， 
得 到 它 的 进程 共享 属性 ， 使 用 Pthread_mutexattr_setpshared 函数 修改 进程 共享 属性 。 


#include <pthread.h> 


int pthread_mutexattr_getpshared(const pthread_mutexattr_t 
*restrict attr, 
int *restrict pshared) ; 


int pthread mutexattr setpshared(pthread mutexattr t *attr, 
int pshared) ; 


两 个 函数 的 返回 值 : 若 成 功 ， 返 回 0， 和 否则 ， 返 回 错误 编号 


进程 共享 互 斥 量 属性 设置 为 PTHREAD PROCESS PRIVATE Hj, fti pthread 线程 库 提 供 更 
有 效 的 互 斥 量 实现 , 这 在 多 线程 应 用 程序 中 是 默认 的 情况 。 在 多 个 进程 共享 多 个 互 斥 量 的 情况 下 ， 

pthread 线程 库 可 以 限制 开销 较 大 的 互 斥 量 实现 。 

互 斥 量 健 半 属性 与 在 多 个 进程 间 共 享 的 互 斥 量 有 关 。 这 意味 着 ,， 当 持 有 互 斥 量 的 进程 终止 时 ， 
需要 解决 互 斥 量 状态 恢复 的 问题 。 这 种 情况 发 生 时 ， 互 斥 量 处 于 锁定 状态 ， 恢 复 起 来 很 困难 。 其 
他 阻塞 在 这 个 锁 的 进程 将 会 一 直 阻 塞 下 去 。 

可 以 使 用 pthread mutexattr getrobust 函数 获取 健壮 的 互 斥 量 属 性 的 值 。 可 以 调 
用 pthread mutexattr_setrobust 函数 设置 健 半 的 互 斥 量 属性 的 值 。 


#include <pthread.h> 





int pthread_mutexattr_getrobust (const pthread mutexattr t 
*restrict attr, 
int *restrict robust) ; 


int pthread mutexattr setrobust(pthread mutexattr t *attr, 
int robust); 


两 个 函数 的 返回 值 ， 若 成 功 ， 返 回 0， 否 则 ， 返 回 错误 编号 





健壮 属性 取 值 有 两 种 可 能 的 情况 。 默 认 值 是 PTHREAD_MUTEX_STALLED， 这 意味 着 持 有 互 
斥 量 的 进程 终止 时 不 需要 采取 特别 的 动作 。 这 种 情况 下 ， 使 用 互 斥 量 后 的 行为 是 未 定义 的 ， 等 待 
该 互 斥 量 解锁 的 应 用 程序 会 被 有 效 地 “ 拖 住 >。 另 一 个 取 值 是 PTHREAD MUTEX_ROBUST。 这 个 值 将 
导致 线程 调用 pthread_mutex_lock 获取 锁 ， 而 该 锁 被 另 一 个 进程 持 有 ， 但 它 终止 时 并 没有 对 
该 锁 进 行 解锁 , 此 时 线程 会 阻塞 , 从 pthread_mutex_lock 返回 的 值 为 EOWNERDEAD 而 不 是 0。 
应 用 程序 可 以 通过 这 个 特殊 的 返回 值 获 知 ， 若 有 可 能 〈 要 保护 状态 的 细节 以 及 如 何 进 行 恢 复 会 因 
不 同 的 应 用 程序 而 异 )， 不 管 它们 保护 的 互 斥 量 状 态 如 何 ， 都 需要 进行 恢复 。 

使 用 健壮 的 互 斥 量 改变 了 我 们 使 用 pthread_mutex_lock 的 方式 ， 因 为 现在 必须 检查 3 个 
返回 值 而 不 是 之 前 的 两 个 : 不 需要 恢复 的 成 功 、 需 要 恢复 的 成 功 以 及 失败 。 但 是 ， 即 使 不 用 健壮 
的 互 斥 量 ， 也 可 以 只 检查 成 功 或 者 失败 。 
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在 本 书 的 4 个 平台 中 ,只 有 Linux 3.2.0 目前 支持 健壮 的 线程 互 斥 量 ,Solaris 10 只 在 它 的 Solaris 
线程 库 中 支持 健壮 的 线程 互 斥 量 (AW Solaris 手册 的 mutex init(3C) 获 取 相关 的 信息 )。 但 是 
Solaris 11 支持 健壮 的 线程 互 斥 量 。 


如 果 应 用 状态 无 法 恢复 ， 在 线程 对 互 斥 量 解锁 以 后 ， 该 互 斥 量 将 处 于 永久 不 可 用 状态 。 为 了 
避免 这 样 的 问题 ， 线 程 可 以 调用 pthread mutex_consistent 函数 ， 指 明 与 该 互 斥 量 相 关 的 
状态 在 互 斥 量 解 锁 之 前 是 一 致 的 。 432 


#include <pthread.h> 


int pthread_mutex_consistent (pthread_mutex_t *mutex) ; 


RAMA: 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 





如 果 线 程 没有 先 调 用 pthread_mutex_consistent 就 对 互 斥 量 进行 了 解锁 ， 那 么 其 他 试 
图 获取 该 互 斥 量 的 阻塞 线程 就 会 得 到 错误 码 ENOTRECOVERRABLE。 如 果 发 生 这 种 情况 ， 互 斥 量 将 
不 再 可 用 。 线程 通 过 提前 调用 pthread mutex_consistent,， 能 让 互 斥 量 正常 工作 , 这 样 它 就 
可 以 持续 被 使 用 。 
类 型 互 斥 量 属性 控制 着 互 斥 量 的 锁定 特性 。POSIX.1 定义 了 4 种 类 型 。 
PTHREAD_MUTEX_NORMAL 一 种 标准 互 斥 量 类 型 ， 不 做 任何 特殊 的 错误 检查 或 死 锁 检 测 。 
PTHREAD MUTEX ERRORCHECK 此 互 斥 量 类 型 提供 错误 检查 。 
PTHREAD MUTEX RECURSIVE 此 互 斥 量 类 型 允许 同一 线程 在 互 斥 量 解锁 之 前 对 该 互 斥 量 
进行 多 次 加 锁 。 递 归 互 斥 量 维护 锁 的 计数 ， 在 解锁 次 数 和 
加 锁 次 数 不 相 同 的 情况 下 ， 不 会 释放 锁 。 所 以 ， 如 果 对 一 
个 递归 互 斥 量 加 锁 两 次 ， 然 后 解锁 一 次 ， 那 么 这 个 互 斥 量 
将 依然 处 于 加 锁 状态 ， 对 它 再 次 解锁 以 前 不 能 释放 该 锁 。 
PTHREAD_MUTEX_DEFAULT 此 互 斥 量 类 型 可 以 提供 默认 特性 和 行为 。 操 作 系统 在 实现 它 
的 时 候 可 以 把 这 种 类 型 自由 地 映射 到 其 他 互 斥 量 类 型 中 的 
一 种 。 例 如 ，Linux 3.2.0 把 这 种 类 型 映射 为 普通 的 互 斥 量 类 
型 ， 而 FreeBSD 8.0 则 把 它 映射 为 错误 检查 互 斥 量 类 型 。 
ix 4 种 类 型 的 行为 如 图 12-5 所 示 。“ 不 占用 时 解锁 ”这 一 栏 指 的 是 ， 一 个 线程 对 被 另 一 个 线 
程 加 锁 的 互 斥 量 进行 解锁 的 情况 .。“ 在 已 解锁 时 解锁 ”这 一 栏 指 的 是 ， 当 一 个 线程 对 已 经 解锁 的 
互 斥 量 进行 解锁 时 将 会 发 生 什 么 ， 这 通常 是 编码 错误 引起 的 。 


| 没有 解锁 时 重新 加 锁 ? | 不 占用 时 解锁 ?| ECR? 


PTHREAD_ | PTHREAD MUTEX NORMAL | NORMAL = | | ex | 
PTHREAD_MUTEX_ERRORCHECK 返回 错误 返回 错误 
PTHREAD_MUTEX_RECURSIVE i 返回 错误 返回 错误 
PTHREAD_MUTEX_DEFAULT j 》 未 定义 未 定义 


图 12-5 互 斥 量 类 型 行为 433 
AJ LAA pthread mutexattr gettype 函数 得 到 互 斥 量 类 型 属性 ， 用 pthread mutexattr 
settype 函数 修改 互 斥 量 类 型 属性 。 


#include <pthread.h> 








int pthread_mutexattr_gettype (const pthread mutexattr t *restrict aftr, int *restrict type); 
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int pthread mutexattr settype(pthread mutexattr t *attr, int type); 


两 个 函数 的 返回 值 : 若 成 功 ， 返 回 0， 否 则 ， 返 回 错误 编号 


回忆 11.6.6 节 中 学 过 的 ， 互 斥 量 用 于 保护 与 条 件 变量 关联 的 条 件 。 在 阻塞 线程 之 前 ，pthread_ 
cond wait 和 pthread cond timedwait 函数 释放 与 条 件 相 关 的 互 斥 量 。 这 就 允许 其 他 线程 获取 
互 斥 量 、 改 变 条 件 、 释 放 互 斥 量 以 及 给 条 件 变量 发 信号 。 既 然 改变 条 件 时 必须 占有 互 斥 量 ， 使 用 递归 互 
斥 量 就 不 是 一 个 好 主意 。 如 果 递 归 互 斥 量 被 多 次 加 锁 ， 然 后 用 在 调用 pthread_cond_wait 函数 中 ， 
那么 条 件 永远 都 不 会 得 到 满足 ， 因 为 pthread cond wait 所 做 的 解锁 操作 并 不 能 释放 互 斥 量 。 

如 果 需 要 把 现 有 的 单线 程 接口 放 到 多 线程 环境 中 ， 递 归 互 斥 量 是 非常 有 用 的 ， 但 由 于 现 有 程 
序 兼 容 性 的 限制 ， 不 能 对 函数 接口 进行 修改 。 然 而 ， 使 用 递归 锁 可 能 很 难处 理 ， 因 此 应 该 只 在 没 
有 其 他 可 行 方案 的 时 候 才 使 用 它们 。 


"m 实例 


12-6 描述 了 一 种 情况 , 在 这 种 情况 中 递归 互 斥 量 看 起 来 像 是 在 解决 并 发 问题 。 假 设 func1 
和 func2 是 函数 库 中 现 有 的 函数 ， 其 接口 不 能 改变 ， 因 为 存在 调用 这 两 个 接口 的 应 用 程序 ， 而 
且 应 用 程序 不 能 改动 。 


main 











funet(x) 
pthread mutex lock(x-»lock) 


func2(x) 


pthread mutex unlock(x-»1lock) 


func? (x) [ funez | 





pthread mutex lock(x-»lock) 


on 
12-6 ”使 用 递归 锁 的 一 种 可 能 情况 
为 了 保持 接口 跟 原 来 相同 ， 我 们 把 互 斥 量 嵌入 到 了 数据 结构 中 ， 把 这 个 数据 结构 的 地 址 〈x) 
作为 参数 传 入 。 这 种 方案 只 有 在 为 此 数据 结构 提供 分 配 函 数 时 才 可 行 ， 所 以 应 用 程序 并 不 知道 数 
据 结构 的 大 小 《假设 我 们 在 其 中 增加 互 斥 量 之 后 必须 扩大 该 数据 结构 的 大 小 )。 
如 果 在 最 早 定义 数据 结构 时 ， 预 留 了 足够 的 可 填充 字段 ， 允 许 把 某 些 填充 字段 替换 成 互 斥 量 ， 这 
种 方法 也 是 可 行 的 。 不 过 遗憾 的 是 ， 大 多 数 程序 员 并 不 善于 预测 未 来 ， 所 以 这 并 不 是 普遍 可 行 的 实践 。 


im funcl 和 func2 函数 都 必须 操作 这 个 结构 ， 而 且 可 能 会 有 一 个 以 上 的 线程 同时 访问 该 
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数据 结构 ， 那 么 funcl 和 func2 必须 在 操作 数据 以 前 对 互 斥 量 加 锁 。 如 果 funci 必须 调用 
func2， 这 时 如 果 互 斥 量 不 是 递归 类 型 的 ， 那 么 就 会 出 现 死 锁 。 如 果 能 在 调用 func2 之 前 释放 
HFE, Æ func2 返回 后 重新 获取 互 斥 量 ， 那 么 就 可 以 避免 使 用 递归 互 斥 量 ， 但 这 也 给 其 他 的 
线程 提供 了 机 会 ， 其 他 的 线程 可 以 在 func] 执行 期 间 抓 住 互 斥 量 的 控制 ， 修 改 这 个 数据 结构 。 
这 也 许 是 不 可 接受 的 ， 当 然 具体 的 情况 要 取决 于 互 斥 量 试图 提供 什么 样 的 保护 。 

图 12-7 显示 了 这 种 情况 下 使 用 递归 互 斥 量 的 一 种 替代 方法 。 通 过 提供 func2 函数 的 私有 版 
本 ， 称 之 为 func2 locked 函数 ， 可 以 保持 funci 和 func2 函数 接口 不 变 ， 而 且 避 免 使 用 递 
归 互 斥 量 。 要 调用 func2 locked 函数 ， 必 须 占 有 嵌入 在 数据 结构 中 的 互 斥 量 ， 这 个 数据 结构 
的 地 址 是 作为 参数 传 入 的 。func2_locked 的 函数 体 包含 func2 的 副本 ，func2 现在 只 是 获取 
互 斥 量 ， 调 用 func2_1locked， 然 后 释放 互 斥 量 。 


main 


re 


pthread_mutex_lock(x->lock) 


func2_locked(x) 





pthread mutex unlock(x-»lock) 


pthread mutex lock(x-»lock) 


func2 locked(x) func2 locked 


pthread mutex unlock(x-»lock) 
图 12-7 ”避免 使 用 递归 锁 的 一 种 可 能 情况 
如 果 并 不 一 定 要 保持 库 函 数 接口 不 变 ， 就 可 以 在 每 个 函数 中 增加 第 二 个 参数 表明 这 个 结构 是 
否 被 调用 者 锁定 。 但 是 ， 如 果 可 以 的 话 ， 保 持 接口 不 变通 常 是 更 好 的 选择 ， 可 以 避免 实现 过 程 中 
人 为 加 入 的 东西 对 原 有 系统 产生 不 良 影响 。 
提供 加 锁 和 不 加 锁 版 本 的 函数 ， 这 样 的 策略 在 简单 的 情况 下 通常 是 可 行 的 。 在 更 加 复杂 的 情况 下 ， 
比如 ， 库 需要 调用 库 以 外 的 函数 ， 而 且 可 能 会 再 次 回调 库 中 的 函数 时 ， 就 需要 依赖 递归 锁 。 w [435] 


m SP 


图 12-8 中 的 程序 解释 了 有 必要 使 用 递归 互 斥 量 的 另 一 种 情况 。 这 里 ， 有 一 个 “超时 ”(timeout) 
函数 ， 它 允许 安排 另 一 个 函数 在 未 来 的 某 个 时 间 运 行 。 假 设 线程 并 不 是 很 昂贵 的 资源 ， 就 可 以 为 每 
个 挂 起 的 超时 函数 创建 一 个 线程 。 线 程 在 时 间 未 到 时 将 一 直 等 待 ， 时 间 到 了 以 后 再 调用 请 求 的 函数 。 
#include <pthread.h> 


#include <time.h> 
#include <sys/time.h> 
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extern int makethread(void *(*) (void *), void *) 


struct to_info { 


void (*to_fn) (void *); /* function */ 
void *to_arg; /* argument */ 
struct timespec to_wait; /* time to wait */ 
#define SECTONSEC 1000000000 /* seconds to nanoseconds */ 
#if !defined(CLOCK REALTIME) || defined(BSD) 
#define clock nanosleep(ID, FL, REQ, REM) nanosleep((REQ), (REM)) 
#endif 
#ifndef CLOCK_REALTIME 
#define CLOCK_REALTIME 0 
#define USECTONSEC 1000 /* microseconds to nanoseconds */ 
void 


clock_gettime(int id, struct timespec *tsp) 


{ 


struct timeval tv; 


gettimeofday(&tv, NULL); 

tsp-»tv sec = tv.tv sec; 

tsp->tv_nsec = tv.tv usec * USECTONSEC; 
) 
#endif 


void * 
timeout helper(void *arg) 
{ 

struct to info *tip; 


tip = (struct to info *)arg; 

clock nanosleep(CLOCK REALTIME, 0, &tip-^to wait, NULL); 
(*tip->to_fn) (tip-^to arg); 

free(arg); 

return(0); 


void 
timeout(const struct timespec *when, void (*func) (void *), void *arg) 
{ 

struct timespec now; 

struct to info "tip, 

int err; 


clock gettime(CLOCK REALTIME, &now); 
if ((when-»5tv sec > now.tv sec) || 
(when-»tv sec == now.tv sec && when-»tv nsec > now.tv nsec)) { 
tip - malloc(sizeof(struct to info)); 
if (tip != NULL) { 
tip->to_fn = func; 
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tip->to_arg = arg; 
tip->to_wait.tv_sec = when->tv_sec - now.tv_sec; 
if (when->tv_nsec >= now.tv_nsec) { 
tip->to_wait.tv_nsec = when->tv_nsec - now.tv_nsec; 
} else { 
tip->to_wait.tv_sec--; 
tip->to_wait.tv_nsec = SECTONSEC - now.tv_nsec + 
when->tv_nsec; 
} 
err = makethread(timeout_helper, (void *)tip); 
if (err == 0) 
return; 
else 
free(tip); 


/* 

* We get here if (a) when <= now, or (b) malloc fails, or 

* (c) we can't make a thread, so we just call the function now. 
sy 


(*func) (arg); 


pthread_mutexattr_t attr; 
pthread_mutex_t mutex; 


void 
retry (void *arg) 
{ 


pthread_mutex_lock (&mutex) ; 
/* perform retry steps ... */ 


pthread_mutex_unlock (&mutex) ; 


int 

main (void) 

{ 
int err, condition, arg; 
struct timespec when; 


if ((err = pthread mutexattr init(&attr)) != 0) 
err exit(err, "pthread mutexattr init failed"); 
if ((err = pthread mutexattr settype(&attr, 


PTHREAD MUTEX RECURSIVE)) !- 0) 
err exit(err, "can't set recursive type"); 
if ((err = pthread mutex init(&mutex, &attr)) !- 0) 


err exit(err, "can't create recursive mutex"); 
/* continue processing ... */ 


pthread mutex lock(&mutex); 
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/* 
* Check the condition under the protection of a lock to 
* make the check and the call to timeout atomic. 


*/ 
if (condition) { 
/* 
* Calculate the absolute time when we want to retry. 
xf 
clock_gettime (CLOCK_REALTIME, &when); 
when.tv_sec += 10; /* 10 seconds from now */ 


timeout (&when, retry, (void *) ((unsigned long) arg)); 
} 
pthread_mutex_unlock (&mutex) ; 


/* continue processing ... */ 


exit(0); 


图 12-8 ”使 用 递归 互 斥 量 
如 果 我 们 不 能 创建 线程 , 或 者 安排 函数 运行 的 时 间 已 过 , 这 时 问题 就 出 现 了 。 在 这 些 情况 下 ， 
我 们 只 需 在 当前 上 下 文中 调用 之 前 请 求 运 行 的 函数 。 因 为 函数 要 获取 的 锁 和 我 们 现在 占有 的 锁 是 
同一 个 ， 所 以 除非 该 锁 是 递归 的 ， 否 则 就 会 出 现 死 锁 。 
在 图 12-4 中 我 们 使 用 makethread 函数 以 分 离 状 态 创建 线程 。 因 为 传递 给 timeout 函数 
的 func 函数 参数 将 在 未 来 运行 ， 所 以 我 们 不 希望 一 直 空 等 线程 结束 。 
可 以 调用 sleep 等 待 超时 到 期 ， 但 它 提供 的 时 间 粒 度 是 秒 级 的 。 如 果 希 望 等 待 的 时 间 不 是 整数 
秒 ， 就 需要 用 nanosleep 或 者 clock nanosleep 函数 ， 它 们 两 个 提供 了 更 高 精度 的 休眠 时 间 。 
在 未 定义 CLOCK REALTIME 的 系统 中 ， 我 们 根据 nanosleep 定义 clock_nanosleep. 
然而 ，FreeBSD 8.0 定义 这 个 符号 支持 clock gettime 和 clock_settime， 但 并 不 支持 
clock_nanosleep» ( RĄ Linux 3.2.0 和 Solaris 10 目前 支持 clock nanosleep.) 
另外 ， 在 未 定义 CLOCK_RERLTIME 的 系统 中 ， 我 们 提供 了 我 们 自己 的 clock_gettime X 
现 ， 该 实现 调用 了 gettimeofday 并 把 微妙 转换 成 纳 秒 。 


timeout 的 调用 者 需要 占有 互 斥 量 来 检查 条 件 , 并且 把 retry 函数 安排 为 原子 操作 。retry 
函数 试图 对 同一 个 互 斥 量 进 行 加 锁 。 除 非 互 斥 量 是 递归 的 ， 否 则 ， 如 果 timeout 函数 直接 调用 
retry， 会 导致 死 锁 。 E 


12.4.2 读 写 锁 属性 


读 写 锁 与 互 斥 量 类 似 ， 也 是 有 属性 的 。 可 以 用 pthread rwlockattr init 初始 化 
pthread rwlockattr t 结构 ， 用 pthread_rwlockattr_destroy 反 初 始 化 该 结构 。 





#include <pthread.h> 


int pthread rwlockattr init(pthread rwlockattr t *attr); 





int pthread rwlockattr destroy(pthread rwlockattr t *attr) 7 


两 个 函数 的 返回 值 : 若 成 功 ， 返 回 0， 否 则 ， 返 回 错误 编号 
读 写 锁 支持 的 唯一 属性 是 进程 共享 属性 。 它 与 互 斥 量 的 进程 共享 属性 是 相同 的 。 就 像 互 斥 量 
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的 进程 共享 属性 一 样 ， 有 一 对 函数 用 于 读 取 和 设置 读 写 锁 的 进程 共享 属性 。 


#include <pthread.h> 


int pthread_rwlockattr_getpshared(const pthread_rwlockattr_t * 
restrict attr, 
int *restrict pshared) ; 


int pthread rwlockattr setpshared(pthread rwlockattr t “attr, 
int pshared) ; 


两 个 函数 的 返回 值 : 若 成 功 ， 返 回 0， 和 否则 ， 返 回 错 误 编 号 


虽然 POSIX 只 定义 了 一 个 读 写 锁 属性 , 但 不 同 平台 的 实现 可 以 自由 地 定义 额外 的 、 非 标准 的 
属性 。 


12.4.3 条件 变量 属性 


Single UNIX Specification 目前 定义 了 条 件 变量 的 两 个 属性 : 进程 共享 属性 和 时 钟 属性 。 与 其 
他 的 属性 对 象 一 样 ， 有 一 对 函数 用 于 初始 化 和 反 初 始 化 条 件 变量 属性 。 


#include <pthread.h> 





int pthread condattr init(pthread condattr t *attr) ; 
int pthread condattr destroy(pthread condattr t *attr); 


两 个 函数 的 返回 值 : 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


与 其 他 的 同步 属性 一 样 , 条 件 变量 支持 进程 共享 属性 。 它 控制 着 条 件 变 量 是 可 以 被 单 进程 的 多 个 
线程 使 用 ， 还 是 可 以 被 多 进程 的 线程 使 用 。 要 获取 进程 共享 属性 的 当前 值 ， 可 以 用 pthread_ 
condattr getpshared 函数 。 设 置 该 值 可 以 用 pthread_condattr_setpshared 函数 。 











#include <pthread.h> 


int pthread_condattr_getpshared(const pthread_condattr_t * 
restrict attr, 
int *restrict pshared) ; 


int pthread condattr setpshared(pthread condattr t *attr, 
int pshared) ; 


两 个 函数 的 返回 值 : 若 成 功 ， 返 回 0;， 否则， 返回 错误 编号 
时 钟 属性 控制 计算 pthread cond timedwait 函数 的 超时 参数 (spr) 时 采用 的 是 哪个 时 钟 。 
合法 值 取 自 图 es 中 列 出 的 时 钟 ID。 可 以 使 用 pthread_condattr_getclock 函数 获取 可 被 用 于 
pthread cond timedwait 函数 的 时 钟 ID， 在 使 用 pthread cond timedwait 函数 前 需要 用 
pthread condattr 七 对 象 对 条 件 变量 进行 初始 化 。 可 以 用 pthread_condattr_setclock 函数 
对 时 钟 ID 进行 修改 。 


#include <pthread.h> 





int pthread_condattr_getclock(const pthread_condattr_t * 
restrict attr, 
clockid_t *restrict clock id); 


int pthread condattr setclock(pthread condattr t *attr, 
clockid t clock id) ; 


两 个 函数 的 返回 值 : 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 
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奇怪 的 是 ，Single UNIX Specification 并 没有 为 其 他 有 超时 等 待 函数 的 属性 对 象 定义 时 钟 属性 。 
12.4.4 ”屏障 属性 


屏障 也 有 属性 。 可 以 使 用 pthread barrierattr init 函数 对 屏障 属性 对 象 进行 初始 化 ， 
用 pthread barrierattr destroy 函数 对 屏障 属性 对 象 进行 反 初始 化 。 


#include <pthread.h> 


int pthread barrierattr init(pthread barrierattr t *attr) ; 


int pthread barrierattr destroy(pthread barrierattr t *attr); 
两 个 函数 的 返回 值 : 若 成 功 ， 返 回 0， 否 则 ， 返 回 错误 编号 
目前 定义 的 屏障 属性 只 有 进程 共享 属性 ， 它 控制 着 屏障 是 可 以 被 多 进程 的 线程 使 用 ， 还 是 只 能 被 


初始 化 屏障 的 进程 内 的 多 线程 使 用 。 与 其 他 属性 对 象 一 样 ， 有 一 个 获取 属性 值 的 函数 Cpthread_ 
barrierattr getpshared) 和 一 个 设置 属性 值 的 函数 (pthread barrierattr setpshared). 





#include <pthread.h> 


int pthread barrierattr getpshared(const pthread barrierattr t * 
restrict attr, 
int *restrict pshared) ; 


int pthread barrierattr setpshared(pthread barrierattr t *attr, 
int pshared) ; 


两 个 函数 的 返回 值 ， 若 成 功 ， 返 回 0， 否 则 ， 返 回 错误 编号 





进程 共享 属性 的 值 可 以 是 PTHREAD PROCESS SHARED (多 进程 中 的 多 个 线程 可 用 )， 也 可 
以 是 PTHREAD PROCESS PRIVATE (只 有 初始 化 屏障 的 那个 进程 内 的 多 个 线程 可 用 )。 


12.5 重 入 


10.6 节 讨 论 了 可 重 入 函数 和 信和 号 处 理 程序 。 线 程 在 遇 到 重 入 问题 时 与 信号 处 理 程序 是 类 似 的 。 
在 这 两 种 情况 下 ， 多 个 控制 线程 在 相同 的 时 间 有 可 能 调用 相同 的 函数 。 

如 果 一 个 函数 在 相同 的 时 间 点 可 以 被 多 个 线程 安全 地 调用 ， 就 称 该 函数 是 线程 安全 的 。 在 Single 
UNIX Specification 中 定义 的 所 有 函数 中 , 除了 图 12-9 中 列 出 的 函数 ， 其 他 函数 都 保证 是 线程 安全 的 。 
另外 ，ctermid 和 tmpnam 函数 在 参数 传 入 空 指针 时 并 不 能 保证 是 线程 安全 的 。 类 似 地 ， 如 果 参 数 
mbstate t 传 入 的 是 空 指针 ， 也 不 能 保证 wcrtomb 和 wcsrtombs 函数 是 线程 安全 的 。 

支持 线程 安全 函数 的 操作 系统 实现 会 在 <unistd.h> 中 定义 符号 _POSIX_THREAD_SAFE_ 
FUNCTIONS。 应 用 程序 也 可 以 在 sysconf 函数 中 传 入 _SC_THREAD_SAFE_FUNCTIONS 参数 在 
运行 时 检查 是 否 支 持 线 程 安全 函数 。 在 SUSv4 之 前 , 要 求 所 有 遵循 XSI 的 实现 都 必须 支持 线程 安 
全 函数 ， 但 是 在 SUSv4 中 ， 线 程 安全 函数 支持 这 个 需求 已 经 要 求 具体 实现 考虑 遵循 POSIX. 

操作 系统 实现 支持 线程 安全 函数 这 个 特性 时 ， 对 POSIX.1 中 的 一 些 非 线程 安全 函数 ， 它 会 提 

供 可 替代 的 线程 安全 版 本 。 图 12-10 列 出 了 这 些 函 数 的 线程 安全 版 本 。 这 些 函 数 的 命名 方式 与 它 
们 的 非 线 程 安全 版 本 的 名 字 相似 ， 只 不 过 在 名 字 最 后 加 了 _r， 表 明 这 些 版 本 是 可 重 入 的 。 很 多 函 
数 并 不 是 线程 安全 的 ， 因 为 它们 返回 的 数据 存放 在 静态 的 内 存 缓冲 区 中 。 通 过 修改 接口 ， 要 求 调 
用 者 自己 提供 缓冲 区 可 以 使 函数 变 为 线程 安全 。 





basename 
catgets 
crypt 
dbm_clearerr 
dbm_close 
dbm_delete 
dbm_error 
dbm_fetch 
dbm_firstkey 
dbm_nextkey 
dbm_open 
dbm_store 
dirname 
dlerror 
drand48 
encrypt 
endgrent 
endpwent 
endutxent 


getc_unlocked 


getchar_unlocked 
getdate 

getenv 

getgrent 


getgrgid 


getgrnam 
gethostent 
getlogin 
getnetbyaddr 
getnetbyname 
getnetent 
getopt 
getprotobyname 
getprotobynumber 
getprotoent 
getpwent 
getpwnam 
getpwuid 
getservbyname 
getservbyport 


getservent 
getutxent 
getutxid 
getutxline 
gmtime 
hcreate 
hdestroy 
hsearch 
inet_ntoa 
164a 
lgamma 
lgammaf 
lgammal 
localeconv 
localtime 
lrand48 
mrand48 
nftw 


nl langinfo 


ptsname 
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putc unlocked 
putchar unlocked 
putenv 
pututxline 
rand 

readdir 
setenv 
setgrent 
setkey 
setpwent 
setutxent 
strerror 
strsignal 
strtok 

system 
ttyname 
unsetenv 
wcstombs 
wctomb 
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Kd 12-9 POSIX.1 中 不 能 保证 线程 安全 的 函数 


getgrgid_r localtime_r 


getgrnam_r readdir_r 
getlogin_r strerror_r 


getpwnam_r strtok_r 


getpwuid_r 


ttyname_r 
gmtime_r 


图 12-10 ”替代 的 线程 安全 函数 

如 果 一 个 函数 对 多 个 线程 来 说 是 可 重 入 的 ， 就 说 这 个 函数 就 是 线程 安全 的 。 但 这 并 不 能 说 明 对 信 
号 处 理 程序 来 说 该 函数 也 是 可 重 入 的 。 如果 函 数 对 异步 信号 处 理 程序 的 重 入 是 安全 的 ， 那么 就 可 以 说 函 
数 是 异步 信号 安全 的 。 我 们 在 10.6 节 中 讨论 可 重 入 函数 时 ， 图 10-4 中 的 函数 就 是 异步 信号 安全 函数 。 

除了 图 12-10 中 列 出 的 函数 ，POSIX.1 还 提供 了 以 线程 安全 的 方式 管理 FILE 对 象 的 方法 。 
可 以 使 用 flockfile 和 ftrylockfile RMAC FILE 对 象 关联 的 锁 。 这 个 锁 是 递归 的 4 
你 占有 这 把 锁 的 时 候 ， 还 是 可 以 再 次 获取 该 锁 ， 而 且 不 会 导致 死 锁 。 虽 然 这 种 锁 的 具体 实现 并 无 
规定 ， 但 要 求 所 有 操作 FILE 对 象 的 标准 IO 例 程 的 动作 行为 必须 看 起 来 就 像 它 们 内 部 调用 了 
flockfile 和 funlockfile。 





#include <stdio.h> 
int ftrylockfile(FILE *fp); 
返回 值 ， 若 成 功 ， 返 回 0， 着 不 能 获取 锁 ， 返 回 非 0 数值 


void flockfile(FILE *fp); 


void funlockfile(FILE *fp); 


虽然 标准 的 VO 例 程 可 能 从 它们 各 自 的 内 部 数据 结构 的 角度 出 发 ， 是 以 线程 安全 的 方式 实现 的 ， 
但 有 时 把 锁 开 放 给 应 用 程序 也 是 非常 有 用 的 。 这 人 允许 应 用 程序 把 多 个 对 标准 VO. 函数 的 调用 组 合成 原 
子 序列 。 当 然 ， 在 处 理 多 个 FILE 对 象 时 ， 需 要 注意 潜在 的 死 锁 ， 需 要 对 所 有 的 锁 仔细 地 排序 。 
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如 果 标 准 VO 例 程 都 获取 它们 各 自 的 锁 ， 那 么 在 做 一 次 一 个 字符 的 IO 时 就 会 出 现 严 重 的 性 
能 下 降 。 在 这 种 情况 下 ， 需 要 对 每 一 个 字符 的 读 写 操作 进行 获取 锁 和 释放 锁 的 动作 。 为 了 避免 这 
种 开销 ， 出 现 了 不 加 锁 版 本 的 基于 字符 的 标准 VO 例 程 。 
#include <stdio.h> 
int getchar unlocked (void); 


int getc unlocked(FILE *fp); 


两 个 函数 的 返回 值 : 若 成 功 ， 返 回 下 一 个 字符 ; 若 遇 到 文件 尾 或 者 出 错 ， 返 回 BOF 


int putchar_unlocked(int c); 


int putc_unlocked(int c, FILE *fp); 





两 个 函数 的 返回 值 : FRH, BE c; 若 出 错 ， 返 回 EOF 


除非 被 flockfile (或 ftrylockfile) 和 funlockfile 的 调用 包围 ， 否 则 尽量 不 要 调用 这 
4 个 函数 , 因为 它们 会 导致 不 可 预期 的 结果 (比如 , 由 于 多 个 控制 线程 非 同步 访问 数据 引起 的 种 种 问题 )。 

一 旦 对 FILE 对 象 进行 加 锁 ， 就 可 以 在 释放 锁 之 前 对 这 些 函 数 进行 多 次 调用 。 这 样 就 可 以 在 
多 次 的 数据 读 写 上 分 摊 总 的 加 解锁 的 开销 。 


"a cl 


图 12-11 显示 了 getenv CJ, 7.9 节 ) 的 一 个 可 能 实现 。 这 个 版 本 不 是 可 重 入 的 。 如 果 两 个 线 
程 同时 调用 这 个 函数 ， 就 会 看 到 不 一 致 的 结果 ， 因 为 所 有 调用 getenv 的 线程 返回 的 字符 串 都 存 
储 在 同一 个 静态 缓冲 区 中 。 


#include <limits.h> 
#include <string.h> 


#define MAXSTRINGSZ 4096 
static char envbuf [MAXSTRINGSZ]; 
extern char **environ; 

char * 

getenv(const char *name) 

{ 


int i, len; 


len = strlen(name) ; 


for (i = 0; environ[i] != NULL; it+) { 
if ((strncmp(name, environ[i], len) == 0) && 
(environ[i] [len] == '-')) { 


strncpy(envbuf, &environ[i][len*1], MAXSTRINGSZ-1) ; 
return (envbuf) ; 
} 
} 
return (NULL); 


图 12-11 getenv 的 非 可 重 入 版 本 
图 12-12 给 出 了 getenv 的 可 重 入 的 版 本 。 这 个 版 本 叫做 getenv_r. 它 使 用 pthread_once 
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函数 来 确保 不 管 多 少 线程 同时 竞争 调用 getenv_r， 每 个 进程 只 调用 thread init 函数 一 次 。 
12.6 节 会 详细 描述 pthread once 函数 。 


#include <string.h> 
#include <errno.h> 

#include <pthread.h> 
#include <stdlib.h> 





extern char **environ; 


pthread_mutex_t env_mutex; 


static pthread_once_t init_done = PTHREAD_ONCE_INIT; 


static void 
thread_init (void) 
{ 
pthread_mutexattr_t attr; 


pthread mutexattr init(&attr); 

pthread mutexattr settype(&attr, PTHREAD MUTEX RECURSIVE); 
pthread mutex init(&env mutex, &attr); 

pthread mutexattr destroy(&attr); 


int 
getenv r(const char *name, char *buf, int buflen) 
{ 


int i, len, olen; 


pthread_once(&init_done, thread_init); 
len = strlen(name); 
pthread_mutex_lock (&env_mutex) ; 


for (i = 0; environ[i] != NULL; i++) { 
if ((strncmp(name, environ[i], len) == 0) && 
(environ[i][len] == '-')) { 


olen = strlen(&environ[i][len*1]); 
if (olen >= buflen) { 
pthread mutex unlock(&env mutex); 
return (ENOSPC) ; 
} 
strcpy (buf, &environ[i] [len+1]); 
pthread_mutex_unlock (&env_mutex) ; 
return (0); 


} 
pthread mutex unlock(&env mutex); 
return (ENOENT) ; 


图 12-12 getenv 的 可 重 入 (线程 安全 ) 版 本 
要 使 getenv_r 可 重 入 ， 需 要 改变 接口 ， 调 用 者 必须 提供 它 自己 的 缓冲 区 ， 这 样 每 个 线程 可 
以 使 用 各 自 不 同 的 缓冲 区 避免 其 他 线程 的 干扰 . 但 是 , 注意 , 要 想 使 getenv_r 成 为 线程 安全 的 ， 
这 样 做 还 不 够 ， 需 要 在 搜索 请 求 的 字符 时 保护 环境 不 被 修改 。 可 以 使 用 互 斥 量 ， 通 过 getenv r 
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和 putenv 函数 对 环境 列表 的 访问 进行 串 行 化 。 

可 以 使 用 读 写 锁 ， 从 而 允许 对 getenv_r 进行 多 次 并 发 访问 ， 但 增加 的 并 发 性 可 能 并 不 会 在 
很 大 程度 上 改善 程序 的 性 能 ， 这 里 面 有 两 个 原因 : 第 一 ， 环 境 列 表 通 常 并 不 会 很 长 ， 所 以 扫描 列 
表 时 并 不 需要 长 时 间 地 占有 互 斥 量 ; 第 二 ， 对 getenv 和 putenv 的 调用 也 不 是 频繁 发 生 的 ， 所 
以 改善 它们 的 性 能 并 不 会 对 程序 的 整体 性 能 产生 很 大 的 影响 。 

即使 可 以 把 getenv r 变 成 线程 安全 的 ， 这 也 不 意味 着 它 对 信和 号 处 理 程序 是 可 重 入 的 。 如 果 使 用 
的 是 非 递 归 的 互 斥 量 ， 线 程 从 信和 号 处 理 程序 中 调用 getenv r 就 有 可 能 出 现 死 锁 。 如 果 信 和 号 处 理 程序 
在 线程 执行 getenv_r 时 中 断 了 该 线程 ， 这 时 我 们 已 经 占有 加 锁 的 env_mutex， 这 样 其 他 线程 试图 对 
这 个 互 斥 量 的 加 锁 就 会 被 阻塞 ， 最 终 导致 线程 进入 死 锁 状 态 。 所 以 ， 必 须 使 用 递归 互 斥 量 阻止 其 他 线程 
改变 我 们 正 需 要 的 数据 结构 ， 还 要 阻止 来 自信 号 处 理 程序 的 死 锁 。 问 题 是 pthread 函数 并 不 保证 是 异步 
言 号 安全 的 ， 所 以 不 能 把 pthread 函数 用 于 其 他 函数 ， 让 该 函数 成 为 异步 信号 安全 的 。 E 


12.6 ”线程 特定 数据 


线程 特定 数据 (thread-specific data)， 也 称 为 线程 私有 数据 (thread-private data)， 是 存储 和 查 
询 某 个 特定 线程 相关 数据 的 一 种 机 制 。 我 们 把 这 种 数据 称 为 线程 特定 数据 或 线程 私有 数据 的 原因 
是 , 我 们 希望 每 个 线程 可 以 访问 它 自己 单独 的 数据 副本 , 而 不 需要 担心 与 其 他 线程 的 同步 访问 问题 。 

线程 模型 促进 了 进程 中 数据 和 属性 的 共享 ， 许 多 人 在 设计 线程 模型 时 会 遇 到 各 种 麻烦 。 那 么 
为 什么 有 人 想 在 这 样 的 模型 中 促进 阻止 共享 的 接口 呢 ? 这 其 中 有 两 个 原因 。 

第 一 ， 有 时 候 需要 维护 基于 每 线程 (per-thread) 的 数据 。 因 为 线程 ID 并 不 能 保证 是 小 而 连续 的 整 
数 ， 所 以 就 不 能 简单 地 分 配 一 个 每 线程 数据 数组 ， 用 线程 ID 作为 数组 的 索引 。 即 使 线程 ID 确实 是 小 而 
连续 的 整数 ， 我 们 可 能 还 希望 有 一 些 额外 的 保护 ， 防 止 某 个 线程 的 数据 与 其 他 线程 的 数据 相 混淆 。 

采用 线程 私有 数据 的 第 二 个 原因 是 ， 它 提供 了 让 基于 进程 的 接口 适应 多 线程 环境 的 机 制 。 一 
个 很 明显 的 实例 就 是 errno. PIZ 1.7 节 中 对 errno 的 讨论 。 以 前 的 接口 〈 线 程 出 现 以 前 ) 把 
errno 定义 为 进程 上 下 文中 全 局 可 访问 的 整数 。 系 统 调用 和 库 例 程 在 调用 或 执行 失败 时 设置 
errno， 把 它 作为 操作 失败 时 的 附属 结果 。 为 了 让 线程 也 能 够 使 用 那些 原本 基于 进程 的 系统 调用 
和 库 例 程 ，errno 被 重新 定义 为 线程 私有 数据 。 这 样 ， 一 个 线程 做 了 重 置 errno 的 操作 也 不 会 
影响 进程 中 其 他 线程 的 errno 值 。 

我 们 知道 一 个 进程 中 的 所 有 线程 都 可 以 访问 这 个 进程 的 整个 地 址 空间 。 除 了 使 用 寄存 器 以 
外 ， 一 个 线程 没有 办 法 阻止 另 一 个 线程 访问 它 的 数据 。 线 程 特定 数据 也 不 例外 。 虽 然 底层 的 实现 
部 分 并 不 能 阻止 这 种 访问 能 力 ， 但 管理 线程 特定 数据 的 函数 可 以 提高 线程 间 的 数据 独立 性 ， 使 得 
线程 不 太 容 易 访 问 到 其 他 线程 的 线程 特定 数据 。 

在 分 配 线程 特定 数据 之 前 ， 需 要 创建 与 该 数据 关联 的 键 。 这 个 键 将 用 于 获取 对 线程 特定 数据 
的 访问 。 使 用 pthread_key_create 创建 一 个 键 。 


#include <pthread.h> 


int pthread key create(pthread key t *keyp, void (*destructor) (void *)); 


返回 值 ， 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 





创建 的 键 存储 在 keyp 指向 的 内 存单 元 中 , 这 个 键 可 以 被 进程 中 的 所 有 线程 使 用 ,但 每 个 线程 C 
把 这 个 键 与 不 同 的 线程 特定 数据 地 址 进行 关联 。 创 建新 键 时 ， 每 个 线程 的 数据 地 址 设 为 空 值 。 
除了 创建 键 以 外 ，pthread_key_create 可 以 为 该 键 关 联 一 个 可 选择 的 析 构 函数 。 当 这 个 
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线程 退出 时 ， 如 果 数 据 地 址 已 经 被 置 为 非 空 值 ， 那 么 析 构 函数 就 会 被 调用 ， 它 唯一 的 参数 就 是 该 
数据 地 址 。 如 果 传 入 的 析 构 函数 为 空 ， 就 表明 没有 析 构 函数 与 这 个 键 关联 。 当 线程 调用 
pthread_exit 或 者 线程 执行 返回 ， 正 常 退出 时 ， 析 构 函数 就 会 被 调用 。 同 样 ， 线 程 取消 时 ， 只 
有 在 最 后 的 清理 处 理 程序 返回 之 后 , 析 构 函数 才 会 被 调用 。 如 果 线 程 调用 了 exit. exit. Exit 
或 abort， 或 者 出 现 其 他 非 正 常 的 退出 时 ， 就 不 会 调用 析 构 函数 。 

线程 通常 使 用 malloc 为 线程 特定 数据 分 配 内 存 。 析 构 函数 通常 释放 已 分 配 的 内 存 。 如 果 线 
程 在 没有 释放 内 存 之 前 就 退出 了 ， 那 么 这 块 内 存 就 会 丢失 ， 即 线程 所 属 进 程 就 出 现 了 内 存 泄漏 。 

线程 可 以 为 线程 特定 数据 分 配 多 个 键 ， 每 个 键 都 可 以 有 一 个 析 构 函数 与 它 关联 。 每 个 键 的 析 
构 函 数 可 以 互 不 相同 ， 当 然 所 有 键 也 可 以 使 用 相同 的 析 构 函数 。 每 个 操作 系统 实现 可 以 对 进程 可 
分 配 的 键 的 数量 进行 限制 (回忆 一 下 图 12-1 中 的 PTHREAD KEYS MAX). 

线程 退出 时 ， 线 程 特定 数据 的 析 构 函数 将 按照 操作 系统 实现 中 定义 的 顺序 被 调用 。 析 构 函 数 
可 能 会 调用 男 一 个 函数 ,该 函数 可 能 会 创建 新 的 线程 特定 数据 ， 并 且 把 这 个 数据 与 当前 的 键 关联 起 
来 。 当 所 有 的 析 构 函数 都 调用 完成 以 后 ， 系 统 会 检查 是 否 还 有 非 空 的 线程 特定 数据 值 与 键 关联 ， 如 
果 有 的 话 ， 再 次 调用 析 构 函数 。 这 个 过 程 将 会 一 直 重 复 直 到 线程 所 有 的 键 都 为 空 线程 特定 数据 值 ， 
或 者 已 经 做 了 PTHREAD DESTRUCTOR ITERATIONS (JL 12-1) 中 定义 的 最 大 次 数 的 尝试。 

对 所 有 的 线程 ,我 们 都 可 以 通过 调用 pthread_key delete 来 取消 键 与 线程 特定 数据 值 之 
间 的 关联 关系 。 


#include <pthread.h> 








int pthread key delete (pthread_key t key); 


返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


注意 ， 调 用 pthread key delete 并 不 会 激活 与 键 关联 的 析 构 函数 。 要 释放 任何 与 键 关 联 
的 线程 特定 数据 值 的 内 存 ， 需 要 在 应 用 程序 中 采取 额外 的 步骤 。 

需要 确保 分 配 的 键 并 不 会 由 于 在 初始 化 阶段 的 竞争 而 发 生变 动 。 下 面 的 代码 会 导致 两 个 线程 
都 调用 pthread_key_create. 





void destructor(void *); 


pthread_key_t key; 
int init_done = 0; 


int 
threadfunc(void *arg) 
{ 
if (!init_done) { 
init done = 1; 
err - pthread key create(&key, destructor); 


) 
有 些 线程 可 能 看 到 一 个 键 值 ， 而 其 他 的 线程 看 到 的 可 能 是 另 一 个 不 同 的 键 值 ， 这 取决 于 系统 是 如 
何 调度 线程 的 ， 解 决 这 种 竞争 的 办 法 是 使 用 pthread_once。 


#include <pthread.h> 
pthread_once_t initflag = PTHREAD_ONCE_INIT; 
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initflag 必须 是 一 个 非 本 地 变量 〈 如 全 局 变量 或 静态 变量 )， 而 且 必 须 初 始 化 为 PTHREAD_ 
ONCE_INIT. 

如 果 每 个 线程 都 调用 pthread_once， 系 统 就 能 保证 初始 化 例 程 initfn 只 被 调用 一 次 ， 即 系 
统 首 次 调用 pthread_once 时 。 创 建 键 时 避免 出 现 冲突 的 一 个 正确 方法 如 下 : 


void destructor(void *); 
pthread_key_t key; 
pthread_once_t init_done = PTHREAD_ONCE_INIT; 
void 
thread_init (void) 
{ 
err = pthread_key_create(&key, destructor); 
} 


int 
threadfunc(void *arg) 
{ 


pthread once(&init done, thread init); 


} 
键 一 旦 创建 以 后 ， 就 可 以 通过 调用 pthread setspecific 函数 把 键 和 线程 特定 数据 关联 
起 来 。 可 以 通过 pthread_getspecific 函数 获得 线程 特定 数据 的 地 址 。 
#include <pthread.h> 


void *pthread getspecific(pthread key t key); 


返回 值 : 线程 特定 数据 值 ， 若 没有 值 与 该 键 关 联 ， 返 回 NULL 
int pthread_setspecific(pthread_key_t key, const void *value) ; 


返回 值 : 若 成 功 ， 返 回 0， 和 否则 ， 返 回 错误 编号 





如 果 没 有 线程 特定 数据 值 与 键 关 联 , pthread_getspecific 将 返回 一 个 空 指针 , 我 们 可 
以 用 这 个 返回 值 来 确定 是 否 需 要 调用 pthread_setspecific. 


PES) 


图 12-11 给 出 了 getenv 的 假设 实现 。 接 着 又 给 出 了 一 个 新 的 接口 ， 提 供 的 功能 相同 ， 不 过 
它 是 线程 安全 的 ( 见 图 12-12)。 但 是 如 果 不 修改 应 用 程序 , 直接 使 用 新 的 接口 会 出 现 什么 问题 呢 ? 
这 种 情况 下 ， 可 以 使 用 线程 特定 数据 来 维护 每 个 线程 的 数据 缓冲 区 副本 ， 用 于 存放 各 自 的 返回 字 
符 串 ， 如 图 12-13 所 示 。 
#include «limits.h» 
#include <string.h> 


#include <pthread.h> 
#include <stdlib.h> 


#define MAXSTRINGSZ 4096 
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static pthread_key_t key; 
static pthread_once_t init_done = PTHREAD_ONCE_INIT; 
pthread_mutex_t env_mutex = PTHREAD_MUTEX_INITIALIZER; 


extern char **environ; 


static void 
thread_init (void) 
{ 
pthread_key_create(&key, free); 


char * 
getenv(const char *name) 
{ 
int i, len; 
char *envbuf; 


pthread_once(&init_done, thread_init); 
pthread_mutex_lock (&env_mutex) ; 
envbuf = (char *)pthread getspecific (key); 


if (envbuf == NULL) { 
envbuf = malloc (MAXSTRINGSZ) ; 
if (envbuf == NULL) { 


pthread_mutex_unlock (&env_mutex) ; 
return (NULL) ; 

} 

pthread setspecific(key, envbuf); 


} 


len = strlen(name); 
for (i = 0; environ[i] != NULL; i++) { 
if ((strncmp (name, environ[i], len) == 0) && 
(environ[i] [len] == '=')) { 


strncpy(envbuf, &environ[i][len*1], MAXSTRINGSZ-1); 
pthread mutex unlock(&env mutex); 
return(envbuf); 


) 
pthread mutex unlock(&env mutex); 
return (NULL); 





图 12-13 ”线程 安全 的 getenv 的 兼容 版 本 


我 们 使 用 pthread_once 来 确保 只 为 我 们 将 使 用 的 线程 特定 数据 创建 一 个 键 。 如 果 
pthread getspecific 返回 的 是 空 指针 ， 就 需要 先 分 配 内 存 缓冲 区 ， 然 后 再 把 键 与 该 内 存 组 
冲 区 关联 。 否则 ， 如 果 返 回 的 不 是 空 指 针 ， 就 使 用 pthread_getspecific 返回 的 内 存 缓冲 区 。 
对 析 构 函数 ， 使 用 free 来 释放 之 前 由 malloc 分 配 的 内 存 。 只 有 当 线 程 特定 数据 值 为 非 空 时 ， 
析 构 函数 才 会 被 调用 。 

注意 ， 虽 然 这 个 版 本 的 getenv 是 线程 安全 的 ， 但 它 并 不 是 异步 信号 安全 的 。 对 信和 号 处 理 程 
序 而 言 ， 即 使 使 用 递归 的 互 斥 量 ， 这 个 版 本 的 getenv 也 不 可 能 是 可 重 入 的 ， 因 为 它 调 用 了 
malloc， 而 malloc 函数 本 身 并 不 是 异步 信号 安全 的 。 s 
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12.7 ”取消 选项 


有 两 个 线程 属性 并 没有 包含 在 pthread attr t 结构 中 , 它们 是 可 取消 状态 和 可 取消 类 型 。 
这 两 个 属性 影响 着 线程 在 响应 pthread_cancel 函数 调用 时 所 呈现 的 行为 ( 见 11.5 节 )。 

可 取消 状态 属性 可 以 是 PTHREAD CANCEL ENRBLE， 也 可 以 是 PTHREAD CANCEL DISABLE. 
线程 可 以 通过 调用 pthread_setcancelstate 修改 它 的 可 取消 状态 。 


#include <pthread.h> 


int pthread setcancelstate(int state, int *oldstate) ; 





返回 值 : 若 成 功 ， 返 回 0， 否 则 ， 返 回 错误 编号 

pthread_setcancelstate 把 当前 的 可 取消 状态 设置 为 state， 把 原来 的 可 取消 状态 存储 在 由 
oldstate 指向 的 内 存单 元 ， 这 两 步 是 一 个 原子 操作 。 

回忆 11.5 节 ，pthread_cancel 调用 并 不 等 待 线程 终止 。 在 默认 情况 下 ， 线 程 在 取消 请 求 发 出 


以 后 还 是 继续 运行 ， 直 到 线程 到 达 某 个 取消 点 。 取 消 点 是 线程 检查 它 是 否 被 取消 的 一 个 位 置 ， 如 果 取 
消 了 ， 则 按照 请 求 行事 。POSIX.1 保证 在 线程 调用 图 12-14 中 列 出 的 任何 函数 时 ， 取 消 点 都 会 出 现 。 


accept mq_timedsend pthread join sendto 
aio_suspend msgrcv pthread testcancel sigsuspend 
clock nanosleep msgsnd pwrite sigtimedwait 
close msync read sigwait 
connect nanosleep readv sigwaitinfo 
creat open recv sleep 


fcntl openat recvfrom system 
fdatasync pause recvmsg tcdrain 
fsync poll select wait 
lockf pread sem timedwait waitid 
mq receive pselect sem wait waitpid 
mq send pthread cond timedwait send write 
mq timedreceive pthread cond wait sendmsg writev 








图 12-14 POSIX.1 定义 的 取消 点 
线程 启动 时 默认 的 可 取消 状态 是 PTHREAD_CRNCEL_ENRBLE 。 当 状态 设 为 PTHREAD_ 
CANCEL DISABLE Hj, X} pthread_cancel 的 调用 并 不 会 杀 死 线程 。 相 反 ， 取 消 请 求 对 这 个 线 
程 来 说 还 处 于 挂 起 状态 ， 当 取消 状态 再 次 变 为 PTHREAD CANCEL ENABLE 时 ， 线 程 将 在 下 一 个 
取消 点 上 对 所 有 挂 起 的 取消 请 求 进行 处 理 。 
451 除了 图 12-14 中 列 出 的 函数 ，POSIX.1 还 指定 了 图 12-15 中 列 出 的 函数 作为 可 选 的 取消 点 。 
图 12-15 中 列 出 的 有 些 函 数 并 没有 在 本 书 中 进一步 讨论 , 例如 ,处 理 消息 分 类 和 宽 字 符 集 的 函数 。 


如 果 应 用 程序 在 很 长 的 一 段 时 间 内 都 不 会 调用 图 12-14 或 图 12-15 中 的 函数 〈 如 数学 计算 领 
域 的 应 用 程序 )， 那 么 你 可 以 调用 pthread_testcancel 函数 在 程序 中 添加 自己 的 取消 点 。 


#include <pthread.h> 
void pthread testcancel (void); 
调用 pthread_testcancel 时 ， 如 果 有 某 个 取消 请 求 正 处 于 挂 起 状态 ， 而 且 取 消 并 没有 置 


为 无 效 ， 那 么 线程 就 会 被 取消 。 但是， 如 果 取 消 被 置 为 无 效 ，pthread_testcancel 调用 就 没 
有 任何 效果 了 。 





access 
catclose 
catgets 
catopen 
chmod 
chown 
closedir 
closelog 
ctermid 
dbm_close 
dbm_delete 
dbm_fetch 
dbm_nextkey 
dbm_open 
dbm_store 
dlclose 
dlopen 
dprintf 
endgrent 
endhostent 
endnetent 
endprotoent 
endpwent 
endservent 
endutxent 
faccessat 
fchmod 
fchmodat 
fchown 
fchownat 
fclose 
fcntl 
fflush 
fgetc 
fgetpos 
fgets 
fgetwc 
fgetws 
fmtmsg 
fopen 
fpathconf 
fprintf 
fputc 
fputs 
fputwc 
fputws 
fread 
freopen 
fscanf 
fseek 


fseeko 
fsetpos 

fstat 

fstatat 

ftell 

ftello 
futimens 
fwprintf 
fwrite 
fwscanf 
getaddrinfo 
getc 

getc unlocked 
getchar 
getchar unlocked 
getcwd 
getdate 
getdelim 
getgrent 
getgrgid 
getgrgid r 
getgrnam 
getgrnam r 
gethostent 
gethostid 
gethostname 
getline 
getlogin 
getlogin r 
getnameinfo 
getnetbyaddr 
getnetbyname 
getnetent 
getopt 
getprotobyname 
getprotobynumber 
getprotoent 
getpwent 
getpwnam 
getpwnam r 
getpwuid 
getpwuid r 
getservbyname 
getservbyport 
getservent 
getutxent 
getutxid 
getutxline 
getwc 


图 12-15 


getwchar 
glob 

iconv close 
iconv open 
ioctl 

link 

linkat 

lio listio 
localtime 
localtime r 
lockf 

lseek 

lstat 

mkdir 
mkdirat 
mkdtemp 
mkfifo 
mkfifoat 
mknod 
mknodat 
mkstemp 
mktime 

nftw 

opendir 
openlog 
pathconf 
pclose 
perror 

popen 

posix fadvise 
posix fallocate 
posix madvise 
posix openpt 
posix spawn 
posix spawnp 


posix typed mem open 


printf 
psiginfo 
psignal 


pthread rwlock rdlock 
pthread rwlock timedrdlock 
pthread rwlock timedwrlock 
pthread rwlock wrlock 


putc 

putc unlocked 
putchar 

putchar unlocked 
puts 

pututxline 


POSIX.1 定义 的 可 选取 消 点 
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putwc 
putwchar 
readdir 
readdir r 
readlink 
readlinkat 
remove 
rename 
renameat 
rewind 
rewinddir 
scandir 
scanf 
seekdir 
semop 
setgrent 
sethostent 
setnetent 
setprotoent 
setpwent 
setservent 
setutxent 
stat 
strerror 
strerror r 
strftime 
symlink 
symlinkat 
sync 
syslog 
tmpfile 
ttyname 
ttyname r 
tzset 
ungetc 
ungetwc 
unlink 
unlinkat 
utimensat 
utimes 
vdprintf 
vfprintf 
vfwprintf 
vprintf 
vwprintf 
wcsftime 
wordexp 
wprintf 
wscanf 





我 们 所 描述 的 默认 的 取消 类 型 也 称 为 推迟 取消 。 调 用 pthread cancel 以 后 ， 在 线程 到 达 取 
消 点 之 前 ， 并 不 会 出 现 真 正 的 取消 。 可 以 通过 调用 pthread setcanceltype 来 修改 取消 类 型 。 


#include <pthread.h> 


int pthread setcanceltype(int type, int *oldtype) ; 


返回 值 : A. EO: 否则， 返回 错误 编号 
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pthread setcanceltype 函数 把 取消 类 型 设置 为 type (类 型 参数 可 以 是 PTHREADCANCEL_ 
DEFERRED， 也 可 以 是 PTHREAD CANCEL _ASYNCHRONOUS)， 把 原来 的 取消 类 型 返回 到 oldtype 
指向 的 整 型 单元 。 

异步 取消 与 推迟 取消 不 同 ， 因 为 使 用 异步 取消 时 ， 线 程 可 以 在 任意 时 间 撤 消 ， 不 是 非得 遇 到 
取消 点 才能 被 取消 。 


12.8 线程 和 信号 


即使 是 在 基于 进程 的 编程 范 型 中 ， 信 和 号 的 处 理 有 时 候 也 是 很 复杂 的 。 把 线程 引入 编程 范 型 ， 
就 使 信号 的 处 理 变 得 更 加 复杂 。 

每 个 线程 都 有 自己 的 信号 屏蔽 字 ， 但 是 信号 的 处 理 是 进程 中 所 有 线程 共享 的 。 这 意味 着 单个 
线程 可 以 阻止 某 些 信号 ， 但 当 某 个 线程 修改 了 与 某 个 给 定 信 号 相关 的 处 理 行为 以 后 ， 所 有 的 线程 
都 必须 共享 这 个 处 理 行 为 的 改变 。 这 样 ， 如 果 一 个 线程 选择 忽略 某 个 给 定 信号 ， 那 么 另 一 个 线程 
就 可 以 通过 以 下 两 种 方式 撤消 上 述 线程 的 信号 选择 : 恢复 信号 的 默认 处 理 行为 ， 或 者 为 信号 设置 
一 个 新 的 信号 处 理 程序 。 

进程 中 的 信号 是 递送 到 单个 线程 的 。 如 果 一 个 信号 与 硬件 故障 相关 ， 那 么 该 信号 一 般 会 被 发 
送 到 引起 该 事件 的 线程 中 去 ， 而 其 他 的 信号 则 被 发 送 到 和 任意 一 个 线程 。 

10.12 节 讨 论 了 进程 如 何 使 用 sigprocmask 函数 来 阻止 信号 发 送 。 然 而 ，sigprocmask 

452] 的 行为 在 多 线程 的 进程 中 并 没有 定义 ， 线 程 必须 使 用 pthread_sigmask。 


#include <signal.h> 


int pthread_sigmask(int how, const sigset_t *restrict set, 


sigset t *restrict oset); 


BMA: FRH, JRO: AW, BERNAS 





pthread sigmask 函数 与 sigprocmask 函数 基本 相同 ,不 过 pthread sigmask 工作 
在 线程 中 ， 而 且 失 败 时 返回 错误 码 ， 不 再 像 sigprocmask 中 那样 设置 errno 并 返回 -1。set 参 
数 包含 线程 用 于 修改 信号 屏蔽 字 的 信号 集 。how 参数 可 以 取 下 列 3 个 值 之 一 : SIG_BLOCK， 把 信 
号 集 添 加 到 线程 信号 屏蔽 字 中 ，SIG_SETMASK， 用 信号 集 蔡 换 线 程 的 信号 屏蔽 字 ; 
SIG_UNBLOCK， 从 线程 信号 屏蔽 字 中 移 除 信号 集 。 如 果 oset 参数 不 为 室 ， 线 程 之 前 的 信和 号 屏蔽 
字 就 存储 在 它 指向 的 sigset t 结构 中 。 线 程 可 以 通过 把 ser 参数 设置 为 NULL， 并 把 oset 参数 
设置 为 sigset t 结构 的 地 址 ， 来 获取 当前 的 信号 屏蔽 字 。 这 种 情况 中 的 how 参数 会 被 忽略 。 

线程 可 以 通过 调用 sigwait 等 待 一 个 或 多 个 信号 的 出 现 。 


#include <signal.h> 





int sigwait(const sigset_t *restrict sef, int *restrict signop); 


BAMA: 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 





set 参数 指定 了 线程 等 待 的 信号 集 。 返 回 时 ，signop 指向 的 整数 将 包含 发 送信 号 的 数量 。 

如 果 信 和 号 集中 的 某 个 信号 在 sigwait 调用 的 时 候 处 于 挂 起 状态 ,那么 sigwait 将 无 阻塞 地 返回 。 
在 返回 之 前 ，sigwait 将 从 进程 中 移 除 那 些 处 于 挂 起 等 待 状态 的 信和 号。 如果 有 具体 实现 支持 排队 信和 号 ， 
并 且 信 和 号 的 多 个 实例 被 挂 起 ， 那 么 sigwait 将 会 移 除 该 信号 的 一 个 实例 ， 其 他 的 实例 还 要 继续 排队 。 

为 了 避免 错误 行为 发 生 ， 线 程 在 调用 sigwait 之 前 ， 必 须 阻 塞 那些 它 正 在 等 待 的 信和 号。 
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sigwait 函数 会 原子 地 取消 信号 集 的 阻塞 状态 , 直到 有 新 的 信号 被 递送 。 在 返回 之 前 ,sigwait 
将 恢复 线程 的 信号 屏 珊 字 。 如 果 信 号 在 sigwait 被 调用 的 时 候 没 有 被 阻塞 ， 那 么 在 线程 完成 对 
sigwait 的 调用 之 前 会 出 现 一 个 时 间 窗 ， 在 这 个 时 间 窗 中 ， 信 号 就 可 以 被 发 送 给 线程 。 

使 用 sigwait 的 好 处 在 于 它 可 以 简化 信号 处 理 , 允许 把 异步 产生 的 信号 用 同步 的 方式 处 理 。 
为 了 防止 信号 中 断 线程 ， 可 以 把 信号 加 到 每 个 线程 的 信号 屏蔽 字 中 。 然 后 可 以 安排 专用 线程 处 理 
信号 。 这 些 专 用 线程 可 以 进行 函数 调用 ， 不 需要 担心 在 信号 处 理 程序 中 调用 哪些 函数 是 安全 的 ， 
因为 这 些 函 数 调用 来 自 正常 的 线程 上 下 文 ， 而 非 会 中 断 线程 正常 执行 的 传统 信号 处 理 程 序 。 

如 果 多 个 线程 在 sigwait 的 调用 中 因 等 待 同一 个 信和 号 而 阻塞 ， 那 么 在 信号 递送 的 时 候 ， 就 
只 有 一 个 线程 可 以 从 sigwait 中 返回 。 如 果 一 个 信号 被 捕获 〈 例 如 进程 通过 使 用 sigaction 
建立 了 一 个 信号 处 理 程 序 )， 而 且 一 个 线程 正在 sigwait 调用 中 等 待 同 一 信号 ， 那 么 这 时 将 由 操 
作 系统 实现 来 决定 以 何 种 方式 递送 信号 。 操 作 系 统 实现 可 以 让 sigwait 返回 ， 也 可 以 激活 信和 号 
处 理 程 序 ， 但 这 两 种 情况 不 会 同时 发 生 。 

要 把 信号 发 送 给 进程 ,可 以 调用 kill CH, 10.9 节 )。 要 把 信号 发 送 给 线程 ， 可 以 调用 pthread_ 
kill. 





#include <signal.h> 





int pthread_kill(pthread_t thread, int signo) ; 
返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


可 以 传 一 个 0 值 的 signo 来 检查 线程 是 否 存 在 。 如 果 信 号 的 默认 处 理 动 作 是 终止 该 进程 ， 那 
么 把 信号 传递 给 某 个 线程 仍然 会 杀 死 整个 进程 。 

注意 ， 闹 钟 定时 器 是 进程 资源 ， 并 且 所 有 的 线程 共享 相同 的 闪 钟 。 所 以 ， 进 程 中 的 多 个 线程 
不 可 能 互 不 干扰 (或 互 不 合作 〉 地 使 用 曾 钟 定时 器 (这 是 习题 12.6 的 内 容 )。 








FEA] 

回忆 图 10-23 所 示 的 程序 ， 我 们 等 待 信号 处 理 程序 设置 标志 表明 主 程序 应 该 退出 。 唯 一 可 运 
行 的 控制 线程 就 是 主线 程 和 信号 处 理 程序 ， 所 以 阻塞 信号 足以 避免 错失 标志 修改 。 在 线程 中 ， 我 
们 需要 使 用 互 斥 量 来 保护 标志 ， 如 图 12-16 中 的 程序 所 示 。 


#include "apue.h" 
#include <pthread.h> 


int quitflag; /* set nonzero by thread */ 
sigset_t mask; 


pthread mutex t lock = PTHREAD MUTEX INITIALIZER; 
pthread cond t waitloc - PTHREAD COND INITIALIZER; 


void * 
thr fn(void *arg) 
{ 


int err, signo; 


for (77) { 
err = sigwait(&mask, &signo); 
if (err != 0) 


err exit(err, "sigwait failed"); 
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switch (signo) { 
case SIGINT: 
printf ("\ninterrupt\n"); 
455 break; 


case SIGQUIT: 
pthread_mutex_lock (&lock) ; 
quitflag = 1; 
pthread mutex unlock(&lock); 
pthread cond signal(&waitloc); 
return(0); 


default: 
printf("unexpected signal %d\n", signo); 
exit (1); 


int 
main(void) 


{ 


int err; 
sigset_t oldmask; 
pthread_t tid; 


sigemptyset (&mask) ; 

sigaddset (&mask, SIGINT); 

sigaddset (&mask, SIGQUIT); 

if ((err = pthread sigmask(SIG BLOCK, &mask, &oldmask)) != 0) 
err exit(err, "SIG BLOCK error"); 


err - pthread create(&tid, NULL, thr fn, 0); 
if (err != 0) 


err exit(err, "can't create thread"); 


pthread mutex lock(&lock); 

while (quitflag -- 0) 
pthread cond wait(&waitloc, &lock); 

pthread mutex unlock(&lock); 


/* SIGQUIT has been caught and is now blocked; do whatever */ 
quitflag = 0; 


/* reset signal mask which unblocks SIGQUIT */ 

if (sigprocmask(SIG SETMASK, &oldmask, NULL) « 0) 
err Sys("SIG SETMASK error"); 

exit(0); 





图 12-16 ”同步 信号 处 理 
我 们 不 用 依赖 信号 处 理 程序 中 断 主 控 线 程 ， 有 专门 的 独立 控制 线程 进行 信号 处 理 。 在 互 斥 量 的 
保护 下 改动 quit flag 的 值 ,这 样 主 控 线程 不 会 在 调用 pthread_cond_signal 时 错失 唤醒 调用 。 
在 主 控 线 程 中 使 用 相同 的 互 斥 量 来 检查 标志 的 值 ， 并 且 原子 地 释放 互 斥 量 ， 等 待 条 件 的 发 生 。 
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注意 ， 在 主线 程 开始 时 阻塞 SIGINT 和 SIGOUIT。 当 创建 线程 进行 信号 处 理 时 ， 新 建 线程 
继承 了 现 有 的 信号 屏蔽 字 。 因 为 sigwait 会 解除 信号 的 阻塞 状态 ， 所 有 只 有 一 个 线程 可 以 用 于 
信和 吕 的 接收 。 这 可 以 使 我 们 对 主线 程 进行 编码 时 不 必 担心 来 自 这 些 信 号 的 中 断 。 

运行 这 个 程序 可 以 得 到 与 图 10-23 类 似 的 输出 结果 : 


$ ./a.out 

^? 输入 中 断 字 符 

interrupt 

^9 再 次 输入 中 断 字符 

interrupt 

^? 再 次 输入 中 断 字符 

interrupt 

n$ 现在 用 退出 符 终止 E 
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当 线 程 调用 fork 时 ， 就 为 子 进 程 创建 了 整个 进程 地 址 空间 的 副本 。 回 忆 8.3 节 中 讨论 的 写 
时 复制 ， 子 进程 与 父 进程 是 完全 不 同 的 进程 ， 只 要 两 者 都 没有 对 内 存 内 容 做 出 改动 ， 父 进程 和 子 
进程 之 间 还 可 以 共享 内 存 页 的 副本 。 

子 进程 通过 继承 整个 地 址 空间 的 副本 ， 还 从 父 进 程 那 儿 继承 了 每 个 互 斥 量 、 读 写 锁 和 条 件 变 
量 的 状态 。 如 果 父 进程 包含 一 个 以 上 的 线程 ， 子 进程 在 fork 返回 以 后 ， 如 果 紧 接着 不 是 马上 调 
用 exec 的 话 ， 就 需要 清理 锁 状 态 。 

在 子 进程 内 部 ， 只 存在 一 个 线程 ， 它 是 由 父 进程 中 调用 fork 的 线程 的 副本 构成 的 。 如 果 父 
进程 中 的 线程 占有 锁 ， 子 进程 将 同样 占有 这 些 锁 。 问 题 是 子 进 程 并 不 包含 占有 锁 的 线程 的 副本 ， 
所 以 子 进程 没有 办 法 知道 它 占 有 了 哪些 锁 、 需 要 释放 哪些 锁 。 

如 果子 进程 从 fork 返回 以 后 马上 调用 其 中 一 个 exec 函数 ， 就 可 以 避免 这 样 的 问题 。 这 种 
情况 下 ， 旧 的 地 址 空间 就 被 丢弃 ， 所 以 锁 的 状态 无 关 紧要 。 但 如 果子 进程 需要 继续 做 处 理工 作 的 
话 ， 这 种 策略 就 行 不 通 ， 还 需要 使 用 其 他 的 策略 。 

在 多 线程 的 进程 中 ， 为 了 避免 不 一 致 状态 的 问题 ，POSIX.1 声明 ， 在 fork 返回 和 子 进程 调 
用 其 中 一 个 exec 函数 之 间 ， 子 进程 只 能 调用 异步 信号 安全 的 函数 。 这 就 限制 了 在 调用 exec 之 
前 子 进程 能 做 什么 ， 但 不 涉及 子 进程 中 锁 状 态 的 问题 。 

要 清除 锁 状 态 ， 可 以 通过 调用 pthread_atfork 函数 建立 fork 处 理 程序 。 

#include <pthread.h> 


int pthread_atfork(void (*prepare) (void), void (*parent) (void), 
void (*child) (void) ); 





返回 值 : 车 成 功 ， 返 回 0， 和 否则， 返回 错误 编号 


用 pthread atfork 了 图 数 最 多 可 以 安装 3 个 帮助 清理 锁 的 函数 。prepare fork 处 理 程序 由 父 进程 
在 fork 创建 子 进程 前 调用 。 这 个 fork 处 理 程序 的 任务 是 获取 父 进 程 定义 的 所 有 锁 。parent fork 处 理 
程序 是 在 fork 创建 子 进程 以 后 、 返 回 之 前 在 父 进程 上 下 文中 调用 的 。 这 个 fork 处 理 程序 的 任务 是 对 
prepare fork 处 理 程序 获取 的 所 有 锁 进行 解锁 。child fork 处 理 程序 在 fork 返回 之 前 在 子 进 程 上 下 文中 
调用 。 与 parent fork 处 理 程序 一 样 ，child fork 处 理 程序 也 必须 释放 prepare fork 处 理 程序 获取 的 所 有 锁 。 
注意 ， 不 会 出 现 加 锁 一 次 解锁 两 次 的 情况 ,虽然 看 起 来 也 许 会 出 现 。 子 进程 地 址 空间 在 创建 时 就 
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得 到 了 父 进程 定义 的 所 有 锁 的 副本 。 因 为 prepare fork 处 理 程序 获取 了 所 有 的 锁 ， 父 进程 中 的 内 存 和 
子 进程 中 的 内 存 内 容 在 开始 的 时 候 是 相同 的 。 当 父 进程 和 子 进程 对 它们 锁 的 副本 进程 解锁 的 时 候 ， 新 
的 内 存 是 分 配给 子 进程 的 ， 父 进程 的 内 存 内 容 是 复制 到 子 进程 的 内 存 中 ( 写 时 复制 )， 所 以 我 们 就 会 
陷入 这 样 的 假象 ， 看 起 来 父 进程 对 它 所 有 的 锁 的 副本 进行 了 加 锁 ， 子 进程 对 它 所 有 的 锁 的 副本 进行 了 
加 锁 。 父 进程 和 子 进 程 对 在 不 同 内 存单 元 的 重复 的 锁 都 进行 了 解锁 操作 ， 就 好 像 出 现 了 下 列 事件 序列 。 

(1) 父 进程 获取 所 有 的 锁 。 

(2) 子 进 程 获取 所 有 的 锁 。 

(3) 父 进 程 释放 它 的 锁 。 

(4) 子 进 程 释放 它 的 锁 。 

可 以 多 次 调用 pthread atfork 函数 从 而 设置 多 套 fork 处 理 程序 。 如 果 不 需 要 使 用 其 中 某 
个 处 理 程序 ， 可 以 给 特定 的 处 理 程序 参数 传 入 空 指针 ， 它 就 不 会 起 任何 作用 了 。 使 用 多 个 fork 处 
理 程序 时 ， 处 理 程序 的 调用 顺序 并 不 相同 。jparent 和 child fork 处 理 程序 是 以 它们 注册 时 的 顺序 进 
行 调用 的 ， 而 prepare fork 处 理 程序 的 调用 顺序 与 它们 注册 时 的 顺序 相反 。 这 样 可 以 允许 多 个 模 
块 注册 它们 自己 的 fork 处 理 程 序 ， 而 且 可 以 保持 锁 的 层次 。 

例如 ， 假 设 模块 4 调用 模块 B 中 的 函数 ， 而 且 每 个 模块 有 自己 的 一 套 锁 。 如 果 锁 的 层次 是 A 
在 8 之 前 , 模块 8 必须 在 模块 4 之 前 设置 它 的 fork 处 理 程序 。 当 父 进程 调用 fork 时 ， 就 会 执行 
以 下 的 步骤 ， 假 设 子 进程 在 父 进 程 之 前 运行 : 

(1) 调用 模块 4 的 prepare fork 处 理 程序 获取 模块 4 的 所 有 锁 。 

(2) 调用 模块 B 的 prepare fork 处 理 程序 获取 模块 妃 的 所 有 锁 。 

(3) 创建 子 进程 。 

(4) 调用 模块 B 中 的 child fork 处 理 程序 释放 子 进程 中 模块 B 的 所 有 锁 。 

(5) 调用 模块 4 中 的 child fork 处 理 程序 释放 子 进程 中 模块 4 的 所 有 锁 。 

(6) fork 函数 返回 到 子 进程 。 

(7) 调用 模块 B 中 的 parent fork 处 理 程 序 释 放 父 进程 中 模块 B 的 所 有 锁 。 

(8) 调用 模块 4 中 的 parent fork 处 理 程 序 来 释放 父 进程 中 模块 4 的 所 有 锁 。 

(9) fork 函数 返回 到 父 进程 。 

如 果 fork 处 理 程序 是 用 来 清理 锁 状 态 的 , 那么 又 由 谁 来 负责 清理 条 件 变量 的 状态 呢 ? 在 有 些 
操作 系统 的 实现 中 ， 条 件 变量 可 能 并 不 需要 做 任何 清理 。 但 是 有 些 操作 系统 实现 把 锁 作为 条 件 变 
量 实现 的 一 部 分 , 这 种 情况 下 的 条 件 变 量 就 需要 清理 。 问题 是 目前 不 存在 允许 清理 锁 状 态 的 接口 。 
如 果 锁 是 嵌入 到 条 件 变 量 的 数据 结构 中 的 ， 那 么 在 调用 fork 之 后 就 不 能 使 用 条 件 变 量 ， 因 为 还 
没有 可 移植 的 方法 对 锁 进 行 状 态 清理 。 另 外 ， 如 果 操 作 系统 的 实现 是 使 用 全 局 锁 保 护 进程 中 所 有 
的 条 件 变量 数据 结构 ， 那 么 操作 系统 实现 本 身 可 以 在 fork 库 例 程 中 做 清理 锁 的 工作 ， 但 是 应 用 
程序 不 应 该 依赖 操作 系统 实现 中 类 似 这 样 的 细节 。 


eB 
图 12-17 中 的 程序 描述 了 如 何 使 用 Pthread_atfork 和 fork 处 理 程序 。 





#include "apue.h" 
#include <pthread.h> 


PTHREAD_MUTEX_INITIALIZER; 
PTHREAD MUTEX INITIALIZER; 


pthread mutex t lockl 
pthread mutex t lock2 
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void 
prepare (void) 


{ 


int err; 


printf ("preparing locks...\n"); 


if ((err = pthread mutex lock(&lockl)) != 0) 
err cont(err, "can't lock lockl in prepare handler"); 
if ((err = pthread mutex lock(&lock2)) !- 0) 


err cont(err, "can't lock lock2 in prepare handler"); 


void 
parent (void) 
{ 


int err; 


printf ("parent unlocking locks...\n"); 


if ((err = pthread_mutex_unlock(&lockl)) != 0) 
err cont(err, "can't unlock lockl in parent handler"); 
if ((err = pthread mutex unlock(&lock2)) != 0) 


err cont(err, "can't unlock lock2 in parent handler"); 


void 
child(void) 
{ 


int err; 


printf ("child unlocking locks...\n"); 


if ((err = pthread_mutex_unlock(&lockl)) != 0) 
err cont(err, "can't unlock lockl in child handler"); 
if ((err = pthread mutex unlock(&lock2)) != 0) 


err cont(err, "can't unlock lock2 in child handler"); 


void * 

thr fn(void *arg) 

{ 
printf ("thread started...\n"); 
pause (); 
return (0); 


int 
main (void) 


{ 


int err; 
pid_t pid; 

pthread_t tid; 

if ((err = pthread_atfork(prepare, parent, child)) != 0) 


err_exit(err, "can't install fork handlers"); 
if ((err = pthread_create(&tid, NULL, thr_fn, 0)) != 0) 
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err_exit(err, "can't create thread"); 


sleep (2); 
printf ("parent about to fork...\n"); 


if ((pid = fork()) < 0) 
err quit ("fork failed"); 
else if (pid == 0) {* child */ 
printf("child returned from fork\n"); 
else /* parent */ 
printf ("parent returned from fork\n"); 
exit (0); 


图 12-17 pthread_atfork 实例 
图 12-17 中 定义 了 两 个 互 斥 量 ，lockl 和 lock2, prepare fork 处 理 程序 获取 这 两 把 锁 , child 


fork 处 理 程 序 在 子 进程 上 下 文中 释放 它们 ，Parent fork 处 理 程序 在 父 进程 上 下 文中 释放 它们 。 


运行 该 程序 ， 得 到 如 下 输出 : 


$ ./a.out 

thread started... 

parent about to fork... 
preparing locks... 

child unlocking locks... 
child returned from fork 
parent unlocking locks... 
parent returned from fork 


可 以 看 到 ，prepare fork 处 理 程序 在 调用 fork 以 后 运行 ，child fork 处 理 程 序 在 fork 调用 返回 到 
子 进程 之 前 运行 ，parent fork 处 理 程序 在 fork 调用 返回 给 父 进 程 之 前 运行 。 u 


虽然 pthread atfork 机 制 的 意图 是 使 fork 之 后 的 锁 状 态 保持 一 致 ， 但 它 还 是 存在 一 些 


不 足 之 处 ， 只 能 在 有 限 情况 下 可 用 。 


。 没有 很 好 的 办 法 对 较 复 杂 的 同步 对 象 〈 如 条 件 变量 或 者 屏障 ) 进行 状态 的 重新 初始 化 。 

。 某 些 错误 检查 的 互 斥 量 实现 在 child fork 处 理 程序 试图 对 被 父 进程 加 锁 的 互 斥 量 进行 解锁 
时 会 产生 错误 。 

。 递归 互 斥 量 不 能 在 child fork 处 理 程序 中 清理 , 因为 没有 办 法 确定 该 互 斥 量 被 加 锁 的 次 数 。 

© 如 果子 进程 只 允许 调用 异步 信号 安全 的 函数 ，child fork 处 理 程序 就 不 可 能 清理 同步 对 象 ， 
因为 用 于 操作 清理 的 所 有 函数 都 不 是 异步 信号 安全 的 。 实 际 的 问题 是 同步 对 象 在 某 个 线 
程 调用 fork 时 可 能 处 于 中 间 状 态 ， 除 非 同 步 对 象 处 于 一 致 状态 ， 否 则 无 法 被 清理 。 

。 如 果 应 用 程序 在 信号 处 理 程 序 中 调用 了 fork( 这 是 合法 的 ， 因为 fork 本 身 是 异步 信号 安 
全 的 )，pthread_atfork 注册 的 fork 处 理 程序 只 能 调用 异步 信号 安全 的 函数 ， 否 则 结 
果 将 是 未 定义 的 。 
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3.11 节 介 绍 了 pread 和 pwrite 函数 。 这 些 函 数 在 多 线程 环境 下 是 非常 有 用 的 ， 因 为 进程 


中 的 所 有 线程 共享 相同 的 文件 描述 符 。 


终 会 


习题 371 


考虑 两 个 线程 ， 在 同一 时 间 对 同一 个 文件 描述 符 进 行 读 写 操作 。 
线程 A 线程 B 
lseek(fd, 300, SEEK SET); lseek(fd, 700, SEEK SET); 
read(fd, bufl, 100); read(fd, buf2, 100); 


如 果 线 程 A 执行 lseek 然后 线程 B 在 线程 A 调用 read 之 前 调用 lseek, 那么 两 个 线程 最 
读 取 同一 条 记录 。 很 显然 这 不 是 我 们 希望 的 。 
为 了 解决 这 个 问题 ， 可 以 使 用 pread， 使 偏 移 量 的 设 定 和 数据 的 读 取 成 为 一 个 原子 操作 。 
线程 A 线程 B 
pread (fd, bufl, 100, 300); pread(fd, buf2, 100, 700); 


使 用 pread 可 以 确保 线程 A 读 取 偏 移 量 为 300 的 记录 , 而 线程 B 读 取 偏 移 量 为 700 的 记录 。 


可 以 使 用 pwrite 来 解决 并 发 线程 对 同一 文件 进行 写 操作 的 问题 。 


12. 


11 小 结 


在 UNIX 系统 中 ， 线 程 提供 了 分 解 并 发 任务 的 另 一 种 模型 。 线 程 促进 了 独立 控制 线程 之 间 的 


共享 ， 但 也 出 现 了 它 特有 的 同步 问题 。 本 章 中 ， 我 们 了 解 了 如 何 调整 线程 和 它们 的 同步 原 语 ， 讨 
论 了 线程 的 可 重 入 性 ， 还 学 习 了 线程 如 何 与 其 他 面向 进程 的 系统 调用 进行 交互 。 


习题 


12.1 
12.2 


12.3 


12.4 


12:5 


12.6 


12:7 


12.8 


在 Linux 系统 中 运行 图 12-17 中 的 程序 ， 但 把 输出 结果 重 定向 到 一 个 文件 中 ， 并 解释 结果 。 
实现 putenv_r， 即 putenv 的 可 重 入 版 本 。 确 保 你 的 实现 既是 线程 安全 的 ， 也 是 异步 信 
号 安全 的 。 

是 否 可 以 通过 在 getenv 函数 开始 的 时 候 阻 塞 信 号 ， 并 在 getenv 函数 返回 之 前 恢复 原来 
的 信号 屏蔽 字 这 种 方法 ， 让 图 12-13 中 的 getenv 函数 变 成 异步 信号 安全 的 ? 解释 其 原因 。 
写 一 个 程序 练习 图 12-13 中 的 getenv 版 本 ， 在 FreeBSD 上 编译 并 运行 程序 ， 会 出 现 什么 
结果 ? 解释 其 原因 。 

假设 可 以 在 一 个 程序 中 创建 多 个 线程 执行 不 同 的 任务 ,为 什么 还 是 有 可 能 会 需要 用 fork? 
解释 其 原因 。 

重新 实现 图 10-29 中 的 程序 ， 在 不 使 用 nanosleep 或 clock nanosleep 的 情况 下 使 它 
成 为 线程 安全 的 。 

调用 fork 以 后 ， 是 否 可 以 通过 首先 用 pthread cond destroy 销毁 条 件 变量 ， 然 后 用 
pthread_cond_init 初始 化 条 件 变 量 这 种 方法 安全 地 在 子 进 程 中 对 条 件 变 量 进行 重新 初 
始 化 ? 

图 12-8 PA) timeout 函数 可 以 大 大 简化 ， 解 释 其 原因 。 
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13.1 引言 


守护 进程 





守护 进程 (daemon) 是 生存 期 长 的 一 种 进程 。 它 们 常常 在 系统 引导 装 入 时 启动 ， 仅 在 系统 关 
闭 时 才 终 止 。 因 为 它们 没有 控制 终端 ， 所 以 说 它们 是 在 后 台 运 行 的 。UNIX 系统 有 很 多 守护 进程 ， 


它们 执行 日 常事 务 活动 。 


本 章 将 说 明 守 护 进 程 结 构 ， 以 及 如 何 编写 守护 进程 程序 。 因 为 守护 进程 没有 控制 终端 ， 我 们 


需要 了 解 在 出 现 问题 时 ， 守 护 进程 如 何 报告 出 错 情况 。 


ps -axj 


有 关 守 护 进程 这 一 术语 被 应 用 于 计算 机 系统 的 历史 背景 ， 详 见 Raymond[1996]。 


13.2 ”守护 进程 的 特征 


让 我 们 先 来 看 一 些 常用 的 系统 守护 进程 ， 以 及 它们 是 怎样 和 第 9 章 中 叙述 的 进程 组 、 控 制 终 
端 和 会 话 这 三 个 概念 相关 联 的 。ps(1) 命 令 打印 系统 中 各 个 进程 的 状态 。 该 命令 有 多 个 选项 ， 有 关 
细节 请 参考 系统 手册 。 为 了 解 本 节 讨 论 中 所 需 的 信息 ， 我 们 在 基于 BSD 的 系统 下 执行 


选项 -a 显示 由 其 他 用 户 所 拥有 的 进程 的 状态 ，-x 显示 没有 控制 终端 的 进程 状态 ，-j 显示 与 作业 
有 关 的 信息 : 会 话 ID、 进 程 组 ID、 控制 终端 以 及 终端 进程 组 ID。 在 基于 System V 的 系统 中 ， 与 
此 相 类 似 的 命令 是 ps -efj (为 了 提高 安全 性 ， 某 些 UNIX 系统 不 允许 用 户 使 用 Ps 命令 查看 不 


属于 自己 的 进程 )。ps 的 输出 大 致 是 : 


UID 

root 
root 
root 
root 
root 
root 
root 
root 
root 
root 
root 
root 
root 


PID 


PPID 


NNNNNNNNNNN CO 


PGID 
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SID 


oo o oc o.oo a: oco oo 


TTY 


"on o) YN VN o VY cJ c] 8) 


COMD 
/sbin/init 
[kthreadd] 
[ksoftirqd/0] 
[migration/0] 
[watchdog/0] 
[cpuset] 
[khelper] 
[sync supers] 
[bdi-default] 
[kblockd] 
[kswapd0] 
[scsi eh 0] 
[jbd2/sda5-8] 
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root 257 2. 0 0 2 [ext4-dio-unwrit] 
syslog 847 1 843 843 ? rsyslogd -c5 

root 906 1 906 906 ? /usr/sbin/cupsd -F 
root 1037 1 1037 1037 ?  /usr/sbin/inetd 
root 1067 1 1067 1067 ? cron 

daemon 1068 1 1068 1068 ? atd 

root 8196 1 8196 8196 ? /usr/sbin/sshd -D 
root 13047 2 0 0 2 [kworker/1:0] 

root 14596 2 0 0 ?  [flush-8:0] 

root 26464 1 26464 26464 ?  rpcbind -w 

statd 28490 1 28490 28490 2 rpc.statd -L 

root 28553 2 0 0 ? [rpciod] 

root 28554 2 0 0 ? [nfsiod] 

root 28561 1 28561 28561 ?  rpc.idmapd 

root 28761 2 0 0 2 [lockd] 

root 28764 2 0 0 ? [nfsd] 

root 28775 1 28775 28775 ? /usr/sbin/rpc.mountd --manage-gids 


Hp, 己 移 去 了 一 些 我 们 不 感 兴 趣 的 列 ， 如 累计 CPU 时 间 。 按 照 顺序 ， 各 列 标题 的 意义 分 别 是 用 
户 ID、 进 程 ID、 父 进程 ID、 进 程 组 ID、 会话 ID、 终 端 名 称 以 及 命令 字符 串 。 
此 ps 命令 在 支持 会 话 ID 的 系统 Linux 3.2.0) L447, 9.5 节 的 setsid 函数 中 曾 提 及 会 话 
ID。 简 单 地 说 ， 它 就 是 会 话 首 进 程 的 进程 ID。 但 是 ， 一些 基于 BSD HAR, de Mac OS X 10.6.8, 
将 打印 与 本 进程 所 属 进程 组 对 应 的 session 结构 的 地 址 ( 见 9.11 节 )， 而 非 会 话 ID 的 地 址 。 


系统 进程 依赖 于 操作 系统 实现 。 父 进程 ID 为 0 的 各 进程 通常 是 内 核 进程 ， 它 们 作为 系统 引 
导 装 入 过 程 的 一 部 分 而 启动 。(init 是 个 例外 ， 它 是 一 个 由 内 核 在 引导 装 入 时 启动 的 用 户 层 次 的 
命令 。) 内 核 进程 是 特殊 的 ， 通 常 存 在 于 系统 的 整个 生命 期 中 。 它 们 以 超级 用 户 特权 和 运行， 无 控 
制 终端 ， 无 命令 行 。 
在 ps 的 输出 实例 中 ， 内 核 守 护 进程 的 名 字 出 现在 方 括号 中 。 该 版 本 的 Linux 使 用 一 个 名 为 
kthreadd 的 特殊 内 核 进程 来 创建 其 他 内 核 进程 ， 所 以 kthreadd 表现 为 其 他 内 核 进程 的 父 进 
程 。 对 于 需要 在 进程 上 下 文 执行 工作 但 却 不 被 用 户 层 进程 上 下 文 调用 的 每 一 个 内 核 组 件 ， 通 常 有 
它 自 己 的 内 核 守护 进程 。 例 如 ， 在 Linux 中 : 
。 kswapd 守护 进程 也 称 为 内 存 换 页 守护 进程 。 它 支持 虚拟 内 存 子 系统 在 经 过 一 段 时 间 后 将 
脏 页 面 慢 慢 地 写 回 磁 盘 来 回收 这 些 页 面 。 

。 flush 守护 进程 在 可 用 内 存 达到 设置 的 最 小 阔 值 时 将 脏 页 面 冲 洗 至 磁盘 。 它 也 定期 地 将 脏 页 面 
冲洗 回 磁盘 来 减少 在 系统 出 现 故障 时 发 生 的 数据 丢失 。 多 个 冲洗 守护 进程 可 以 同时 存在 ， 每 个 
写 回 的 设备 都 有 一 个 冲洗 守护 进程 .输出 实例 中 显示 出 一 个 名 为 flush-8 :0 的 冲洗 守护 进程 。 
从 名 字 中 可 以 看 出 ， 写 回 设备 是 通过 主 设备 号 (8) 和 副 设备 号 (0) 来 识别 的 。 

。 sync supers 守护 进程 定期 将 文件 系统 元 数据 冲洗 至 磁盘 。 

。 jbd 守护 进程 帮助 实现 了 ext4 文件 系统 中 的 日 志 功能 。 

进程 1 通常 是 init (Mac OS X 中 是 launchd)，8.2 节 对 此 做 过 说 明 。 它 是 一 个 系统 守护 
进程 ， 除 了 其 他 工作 外 ， 主 要 负责 启动 各 运行 层次 特定 的 系统 服务 。 这 些 服务 通常 是 在 它们 自己 
拥有 的 守护 进程 的 帮助 下 实现 的 。 

rpcbind 守护 进程 提供 将 远程 过 程 调用 (Remote Procedure Call, RPC) 程序 号 映射 为 网 络 端口 号 
的 服务 。rsys1logq 守护 进程 可 以 被 由 管理 员 启用 的 将 系统 消息 记 入 日 志 的 任何 程序 使 用 。 可 以 在 一 台 
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实际 的 控制 台 上 打印 这 些 消息 ， 也 可 将 它们 写 到 一 个 文件 中 。(13.4 节 将 对 syslog 设施 进行 说 明 。) 

9.3 WORF) inetd 守护 进程 。 它 侦 听 系统 网 络 接 口 ， 以 便 取得 来 自 网 络 的 对 各 种 网 络 服务 
进程 的 请 求 。nfsd、nfsiod、lockd、rpciod、 rpc.idmapd、 rpc.statd 和 rpc.mountd 
守护 进程 提供 对 网 络 文件 系统 (Network File System, NFS) 的 支持 。 注 意 ， 前 4 个 是 内 核 守护 进 
程 ， 后 3 个 是 用 户 级 守护 进程 。 

cron 守护 进程 在 定期 安排 的 日 期 和 时 间 执 行 命令 。 许 多 系统 管理 任务 是 通过 cron 每 隔 一 段 固 
定 的 时 间 就 运行 相关 程序 而 得 以 实现 的 。ata 守护 进程 与 cron 类 似 ,， 它 允许 用 户 在 指定 的 时 间 执 行 
任务 ， 但 是 每 个 任务 它 只 执行 一 次 ， 而 非 在 定期 安排 的 时 间 反 复 执行 。cupsa 守护 进程 是 个 打印 假 
脱 机 进程 ， 它 处 理 对 系统 提出 的 各 个 打印 请 求 。sshd 守护 进程 提供 了 安全 的 远程 登录 和 执行 设施 。 

注意 ， 大 多 数 守护 进程 都 以 超级 用 户 (root) 特权 运行 。 所 有 的 守护 进程 都 没有 控制 终端 ， 
其 终端 名 设置 为 问号 。 内 核 守 护 进程 以 无 控制 终端 方式 启动 。 用 户 层 守护 进程 缺少 控制 终端 可 能 
是 守护 进程 调用 了 setsid 的 结果 。 大 多 数 用 户 层 守护 进程 都 是 进程 组 的 组 长 进程 以 及 会 话 的 首 
进程 ， 而 且 是 这 些 进 程 组 和 会 话 中 的 唯一 进程 (rsyslogd 是 一 个 例外 )。 最 后 ， 应 当 引 起 注意 
的 是 用 户 层 守护 进程 的 父 进程 是 init 进程 。 


13.3 ”编程 规则 


在 编写 守护 进程 程序 时 需 遵循 一 些 基本 规则 ， 以 防止 产生 不 必要 的 交互 作用 。 下 面 先 说 明 这 
些 规则 ， 然 后 给 出 一 个 按照 这 些 规 则 编写 的 函数 daemonize. 

(1) 首先 要 做 的 是 调用 umask 将 文件 模式 创建 屏蔽 字 设 置 为 一 个 已 知 值 〈 通 常 是 0)。 由 继 
承 得 来 的 文件 模式 创建 屏蔽 字 可 能 会 被 设置 为 拒绝 某 些 权限 。 如 果 守 护 进程 要 创建 文件 ， 那 么 它 
可 能 要 设置 特定 的 权限 。 例 如 ， 若 守护 进程 要 创建 组 可 读 、 组 可 写 的 文件 ， 继 承 的 文件 模式 创建 
屏蔽 字 可 能 会 屏蔽 上 述 两 种 权限 中 的 一 种 ， 而 使 其 无 法 发 挥 作用 。 另 一 方面 ， 如 果 守 护 进 程 调用 
的 库 函 数 创建 了 文件 ， 那 么 将 文件 模式 创建 屏蔽 字 设 置 为 一 个 限制 性 更 强 的 值 (如 007) 可 能 会 
更 明智 ， 因 为 库 函 数 可 能 不 允许 调用 者 通过 一 个 显 式 的 函数 参数 来 设置 权限 。 

(2) 调用 fork， 然后 使 父 进程 exit。 这 样 做 实现 了 下 面 几 点 。 第 一 ， 如 果 该 守护 进程 是 作 
为 一 条 简单 的 shell 命令 启动 的 ， 那 么 父 进程 终止 会 让 shell 认为 这 条 命令 已 经 执行 完毕 。 第 二 ， 
虽然 子 进程 继承 了 父 进 程 的 进程 组 ID， 但 获得 了 一 个 新 的 进程 ID， 这 就 保证 了 子 进程 不 是 一 个 
进程 组 的 组 长 进程 。 这 是 下 面 将 要 进行 的 setsid 调用 的 先决 条 件 。 

(3) 调用 setsid 创建 一 个 新 会 话 。 然 后 执行 9.5 节 中 列 出 的 3 个 步骤 ， 使 调用 进程 : (a) 成 为 

会 话 的 首 进 程 ，(b) 成 为 一 个 新 进程 组 的 组 长 进程 ，(c) 没有 控制 终端 。 


在 基于 System V 的 系统 中 ， 有 些 人 建议 在 此 时 再 次 调用 fork， 终 止 父 进程 ， 继 续 使 用 子 进 
程 中 的 守护 进程 。 这 就 保证 了 该 守护 进程 不 是 会 话 首 进程 ， 于 是 按照 System V 规则 ( 见 9.6 节 ) 
可 以 防止 它 取 得 控制 终端 。 为 了 避免 取得 控制 终端 的 另 一 种 方法 是 , 无 论 何 时 打开 一 个 终端 设备 ， 
都 一 定 要 指定 O_ NOCTTY。 


(4) 将 当前 工作 目录 更 改 为 根 目录 。 从 父 进程 处 继承 过 来 的 当前 工作 目录 可 能 在 一 个 挂 载 的 
文件 系统 中 。 因 为 守护 进程 通常 在 系统 再 引导 之 前 是 一 直 存在 的 ， 所 以 如 果 守 护 进 程 的 当前 工作 
目录 在 一 个 挂 载 文件 系统 中 ， 那 么 该 文件 系统 就 不 能 被 卸载 。 

或 者 ， 某 些 守 护 进 程 还 可 能 会 把 当前 工作 目录 更 改 到 某 个 指定 位 置 ， 并 在 此 位 置 进行 它们 的 
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全 部 工作 。 例 如 ， 行 式 打印 机 假 脱 机 守护 进程 就 可 能 将 其 工作 目录 更 改 到 它们 的 spool 目录 上 。 

C5) 关闭 不 再 需要 的 文件 描述 符 。 这 使 守护 进程 不 再 持 有 从 其 父 进程 继承 来 的 任何 文件 描述 
符 ( 父 进程 可 能 是 shell 进程 ， 或 某 个 其 他 进程 )。 可 以 使 用 open max 函数 ( 见 2.17 节 ) 或 
getrlimit 函数 (W711) 来 判定 最 高 文件 描述 符 值 ， 并 关闭 直到 该 值 的 所 有 描述 符 。 

(6) 某 些 守护 进程 打开 /dev/null 使 其 具有 文件 描述 符 0、1 和 2， 这 样 ， 任 何 一 个 试图 读 标 准 
输入 、 写 标准 输出 或 标准 错误 的 库 例 程 都 不 会 产生 任何 效果 。 因 为 守护 进程 并 不 与 终端 设备 相关 联 ， 
所 以 其 输出 无 处 显示 ， 也 无 处 从 交互 式 用 户 那 里 接收 输入 。 即 使 守护 进程 是 从 交互 式 会 话 启动 的 , 但 
是 守护 进程 是 在 后 台 运 行 的 ， 所 以 登录 会 话 的 终止 并 不 影响 守护 进程 。 如 果 其 他 用 户 在 同一 终端 设备 
上 登录 , 我 们 不 希望 在 该 终端 上 见 到 守护 进程 的 输出 ， 用 户 也 不 期 望 他 们 在 终端 上 的 输入 被 守护 进程 
读 取 。 


s KB 
图 13-1 所 示 的 函数 可 由 一 个 想 要 初始 化 为 守护 进程 的 程序 调用 。 


#include "apue.h" 
#include <syslog.h> 
#include <fcntl.h> 
#include <sys/resource.h> 


void 
daemonize(const char *cmd) 


{ 


int 1l, £20, fdl, fd2; 
pid t pid; 
struct rlimit rl; 


struct sigaction sa; 


/* 

* Clear file creation mask. 
* 

umask (0) ; 


/* 

* Get maximum number of file descriptors. 

*y 

if (getrlimit(RLIMIT NOFILE, &rl) < 0) 
err_quit("%s: can't get file limit", cmd); 


/* 
* Become a session leader to lose controlling TTY. 
sY 
if ((pid = fork()) < 0) 
err_quit("%s: can't fork", cmd); 
else if (pid != 0) /* parent */ 
exit (0); 
setsid(); 


/* 

* Ensure future opens won't allocate controlling TTYs. 
*7 

sa.sa handler = SIG IGN; 
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467 sigemptyset (&sa.sa_mask) ; 
sa.sa_flags = 0; 
if (sigaction(SIGHUP, &sa, NULL) < 0) 
err quit("$s: can't ignore SIGHUP", cmd); 
if ((pid = fork()) < 0) 
err_quit("%s: can't fork", cmd); 
else if (pid != 0) /* parent */ 
exit(0); 


/* 
* Change the current working directory to the root so 
* we won't prevent file systems from being unmounted. 
bd 
if (cbdir("/") «0) 

err quit("$s: can't change directory to /", cmd); 


/* 

* Close all open file descriptors. 
wif 

if (rl.rlim_max == RLIM_INFINITY) 


rl.rlim_max = 1024; 
for (1 = 0; i « rl.rlim max; i++) 
close (i); 


/* 

* Attach file descriptors 0, 1, and 2 to /dev/null. 
vy 

fd0 = open("/dev/null", O_RDWR); 

fdl = dup(0); 

fd2 = dup(0); 

/* 

* Initialize the log file. 

*y 


openlog(cmd, LOG CONS, LOG DAEMON); 
if (fdO t= 0 || fdl t= 1 || faz != 2) { 
syslog(LOG_ERR, "unexpected file descriptors %d %d %d", 
£40, fdl, fd2); 
exit(1); 





图 13-1 初始 化 一 个 守护 进程 
若 daemonize 函数 由 main 程序 调用 , 然后 main 程序 进入 休眠 状态 , 那么 可 以 用 ps 命令 
检查 该 守护 进程 的 状态 : 


$ ./a.out 

$ ps -efj 

UID PID PPID PGID SID TTY CMD 

sar 13800 1 13799 13799 3 ./a.out 
$ ps -efj | grep 13799 

sar 13800 1 13799 13799 ? ./a.out 


我 们 也 可 用 ps 命令 验证 ， 没 有 活动 进程 存在 的 ID 是 13799。 这 意味 着 ， 守 护 进程 在 一 个 孤儿 进程 


Arp On 9.10 节 )， 它 不 是 会 话 首 进程 ， 因 此 没有 机 会 被 分 配 到 一 个 控制 终端 。 这 一 结果 是 在 
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daemonize 函数 中 执行 第 二 个 fork 造成 的 。 可 以 看 出 ， 守 护 进 程 已 经 被 正确 地 初始 化 了 。 u 
13.4 出 错 记 录 


守护 进程 存在 的 一 个 问题 是 如 何 处 理 出 错 消息 。 因 为 它 本 就 不 应 该 有 控制 终端 ， 所 以 不 能 只 
是 简单 地 写 到 标准 错误 上 。 我 们 不 希望 所 有 守护 进程 都 写 到 控制 台 设 备 上 ， 因 为 在 很 多 工作 站 上 
控制 台 设备 都 运行 着 一 个 窗口 系统 。 我 们 也 不 希望 每 个 守护 进程 将 它 自己 的 出 错 消息 写 到 一 个 单 
独 的 文件 中 。 对 任何 一 个 系统 管理 人 员 而 言 , 如 果 要 关心 哪 一 个 守护 进程 写 到 哪 一 个 记录 文件 中 ， 
并 定期 地 检查 这 些 文件 ， 那 么 一 定 会 使 他 感到 头痛 。 所 以 ， 需 要 有 一 个 集中 的 守护 进程 出 错 记录 
设施 。 

BSD syslog 设施 是 在 伯克利 开发 的 ， 广 泛 应 用 于 4.2BSD。 从 BSD 派生 的 很 多 系统 都 支持 
syslog。 在 SVR4 之 前 ，System V 中 从 来 没有 一 个 集中 的 守护 进程 记录 设施 。 在 Single UNIX 
Specification 的 XSI 扩展 中 包括 了 syslog BK, 

自 4.2BSD 以 来 , BSD 的 syslog 设施 得 到 了 广泛 的 应 用 。 大 多 数 守护 进程 都 使 用 这 一 设施 。 


图 13-2 显示 了 syslog 设施 的 详细 组 织 结构 。 
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图 13-2 BSD 的 syslog 设施 
有 以 下 3 种 产生 日 志 消 息 的 方法 。 


(OD 内 核 例 程 可 以 调用 log 函数 。 任 何 一 个 用 户 进程 都 可 以 通过 打开 〈open) 并 读 取 
(read) /dev/klog 设备 来 读 取 这 些 消息 。 因 为 我 们 无 意 编 写 内 核 例 程 ， 所 以 不 再 进一步 说 
明 此 函数 。 

(2) 大 多 数 用 户 进 程 〈 守 护 进程 ) 调用 syslog(3) 函 数 来 产生 日 志 消息 。 我 们 将 在 下 面 说 明 
其 调用 序列 。 这 使 消息 被 发 送 至 UNIX 域 数据 报 套 接 字 /dev/1og。 

(3) 无 论 一 个 用 户 进程 是 在 此 主机 上 ， 还 是 在 通过 TCP/IP 网 络 连 接 到 此 主机 的 其 他 主机 上 ， 
都 可 将 日 志 消 息 发 向 UDP 端口 514。 注 意 ，syslog 函数 从 不 产生 这 些 UDP 数据 报 ， 它 们 要 求 
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产生 此 日 志 消息 的 进程 进行 显 式 的 网 络 编程 。 

XT UNIX 域 套 接 字 以 及 UDP 套 接 字 的 细节 ， 请 参阅 Stevens. Fenner 和 Rudoff[2004]。 

Wifi, syslogd 守护 进程 读 取 所 有 3 种 格式 的 日 志 消 息 。 此 守护 进程 在 启动 时 读 一 个 配置 文 
件 ， 其 文件 名 一 般 为 /etc/syslog .conf， 该 文件 决定 了 不 同 种 类 的 消息 应 送 向 何 处 。 例 如 ， 
紧急 消息 可 发 送 至 系统 管理 员 〈 若 已 登录 )， 并 在 控制 台 上 打印 ， 而 警告 消息 则 可 记录 到 一 个 文 
件 中 。 

该 设施 的 接口 是 syslog 函数 。 


#include <syslog.h> 





void openlog(const char *ident, int option, int facility) ; 
void syslog(int priority, const char *format, ...); 
void closelog(void); 


int setlogmask(int maskpri); 





返回 值 : 前 日 志 记 录 优 先 级 屏蔽 字 值 


调用 openlog 是 可 选择 的 。 如 果 不 调用 open1log， 则 在 第 一 次 调用 syslog 时 ， 自 动 调用 
openlog。 调 用 closelog 也 是 可 选择 的 ， 因 为 它 只 是 关闭 曾 被 用 于 与 syslogd 守护 进程 进行 
通信 的 描述 符 。 

调用 openlog 使 我 们 可 以 指定 一 个 ident， 以 后 ， 此 ident 将 被 加 至 每 则 日 志 消 息 中 。ident 
一 般 是 程序 的 名 称 ( 如 cron, inetd). option 参数 是 指定 各 种 选项 的 位 屏蔽 。 图 13-3 介绍 了 可 
用 的 option (选项 )。 若 在 Single UNIX Specification 的 openlog 定义 中 包括 了 该 选项 ， 则 在 XSI 
列 中 用 一 个 黑 点 表示 。 





LOG_CONS 若 日 志 消息 不 能 通过 UNIX 域 数据 报 送 至 syslogd， 则 将 该 消息 写 至 控制 台 

LOG NDELAY 立即 打开 至 syslogd 守护 进程 的 UNIX 域 数据 报 套 接 字 ， 不 要 等 到 第 一 条 消息 
已 经 被 记录 时 再 打开 。 通 常 ， 在 记录 第 一 条 消息 之 前 ， 不 打开 该 套 接 字 

LOG_NOWAIT 不 要 等 待 在 将 消息 记 入 日 志 过 程 中 可 能 已 创建 的 子 进程 。 因 为 在 syslog 调用 


wait 时 ， 应 用 程序 可 能 已 获得 了 子 进程 的 状态 ， 这 种 处 理 阻止 了 与 捕 提 SIGCHLD 
信号 的 应 用 程序 之 间 产 生 的 冲突 

LOG_ODELAY 在 第 一 条 消息 被 记录 之 前 延迟 打开 至 syslogd 守护 进程 的 连接 

LOG_PERROR 除 将 日 志 消息 发 送 给 syslogd 以 外 , 还 将 它 写 至 标准 出 错 (在 Solaris 上 不 可 用 ) 

LOG_PID 记录 每 条 消息 都 要 包含 进程 ID。 此 选项 可 供 对 每 个 不 同 的 请 求 都 fork 一 个 子 进 
程 的 守护 进程 使 用 (与 从 不 调用 fork 的 守护 进程 相 比 较 ， 如 syslogd) 





图 13-3 openlog 的 option 参数 

openlog 的 facility 参数 值 选取 自 图 13-4。 注 意 ，Single UNIX Specification 只 定义 了 facility 
所 有 参数 值 中 的 一 个 子 集 ， 该 子 集 一 般 只 能 用 在 一 个 给 定 的 平台 上 。 RE facility 参数 的 目的 是 可 
以 让 配置 文件 说 明 , 来 自 不 同 设施 的 消息 将 以 不 同 的 方式 进行 处 理 。 如 果 不 调 用 openlog, 或 者 
以 facility 为 0 来 调用 它 ， 那 么 在 调用 syslog 时 ,可 将 facility 作为 priority 参数 的 一 个 部 分 进行 
说 明 。 

调用 syslog 产生 一 个 日 志 消 息 。 其 priority 参数 是 facility 和 level 的 组 合 ， 它 们 可 选取 
的 值 分 别 列 于 facility (ILE 13-4) 和 level (WLAN 13-5) Po level 值 按 优先 级 从 最 高 到 最 低 依 
次 排列 。 


LOG_AUDIT 
LOG_AUTH 


LOG_AUTHPRIV 


LOG_CONSOLE 
LOG_CRON 
LOG_DAEMON 
LOG_FTP 
LOG_KERN 
LOG_LOCALO 
LOG_LOCAL1 
LOG_LOCAL2 
LOG_LOCAL3 
LOG_LOCAL4 
LOG_LOCAL5 
LOG_LOCAL6 
LOG_LOCAL7 
LOG_LPR 
LOG_MAIL 
LOG_NEWS 
LOG_NTP 
LOG_SECURITY 
LOG_SYSLOG 





审计 设施 

授权 程序 ，login、su、getty 等 
与 LOG_AUTH 相同 , 但 写 日 志文 件 时 具 
有 权限 限制 

消息 写 入 /dev/console 

cron 和 at 

系统 守护 进程 : inetd. routed 等 
FTP 守护 进程 (ftpd) 

内 核 产 生 的 消息 

保留 由 本 地 使 用 

保留 由 本 地 使 用 

保留 由 本 地 使 用 

保留 由 本 地 使 用 

保留 由 本 地 使 用 

保留 由 本 地 使 用 

保留 由 本 地 使 用 

保留 由 本 地 使 用 

行 式 打印 机 系统 :， 1pd、1lpc 等 
邮件 系统 

Usenet 网 络 新 闻 系 统 

网 络 时 间 协 议 系统 

安全 子 系统 

syslogd 守护 进程 本 身 
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来 自 其 他 用 户 进程 的 消息 默认) 
UUCP 系统 


LOG_USER 
LOG_UUCP 





图 13-4 openlog 的 facility 参数 


紧急 (系统 不 可 使 用 )〔 最 高 优先 级 ) 
必须 立即 修复 的 情况 

严重 情况 (如 硬件 设备 出 错 ) 

出 错 情况 

警告 情况 

正常 但 重要 的 情况 

信息 性 消息 

调试 消息 最 低 优 先 级 ) 


图 13-5 syslog 中 的 level ( 按 序 排列 ) 

将 format 参数 以 及 其 他 所 有 参数 传 至 vsprintf 函数 以 便 进行 格式 化 。 在 format 中 ， 每 个 
出 现 的 sm 字符 都 先 被 代 换 成 与 errno 值 对 应 的 出 错 消 息 字 符 串 (strerror)。 

setlogmask 函数 用 于 设置 进程 的 记录 优先 级 屏蔽 字 。 它 返回 调用 它 之 前 的 屏蔽 字 。 当 设置 
了 记录 优先 级 屏蔽 字 时 ， 各 条 消息 除非 已 在 记录 优先 级 屏蔽 字 中 进行 了 设置 ， 和 否则 将 不 被 记录 。 
注意 ， 试 图 将 记录 优先 级 屏蔽 字 设 置 为 0 并 不 会 有 什么 作用 。 

很 多 系统 也 将 logger(1) 程 序 作为 向 syslog 设施 发 送 日 志 消 息 的 方法 。 虽 然 Single UNIX 
Specification 没有 定义 任何 可 选 参数 ， 但 某 些 实现 允 许 将 该 程序 的 可 选 参数 指定 为 facility. level 
和 ident. Logger 命令 是 专门 为 以 非 交 互 方式 运行 的 需要 产生 日 志 消 息 的 shell 脚本 设计 的 。 


LOG_EMERG 
LOG_ALERT 
LOG_CRIT 


LOG_ERR 
LOG_WARNING 
LOG_NOTICE 
LOG_INFO 
LOG_DEBUG 
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s X 
在 一 个 (假定 的 ) 行 式 打印 机 假 脱 机 守护 进程 中 ， 可 能 包含 有 下 面 的 调用 序列 


openlog("lpd", LOG PID, LOG LPR); 
syslog(LOG ERR, "open error for $s: $m", filename); 


第 一 个 调用 将 ident 字符 串 设置 为 程序 名 ,指定 该 进程 ID 要 始终 被 打印 ,并 且 将 系统 默认 的 facility 
设 定 为 行 式 打印 机 系统 。 对 syslog 的 调用 指定 一 个 出 错 条 件 和 一 个 消息 字符 串 。 如 若 不 调用 
openlog， 则 第 二 个 调用 的 形式 可 能 是 : 
syslog(LOG_ERR | LOG_LPR, "open error for %s: %m", filename); 
其 中 ， 将 priority 参数 指定 为 level 和 facility 的 组 合 。 a 
除了 syslog， 很 多 平台 还 提供 它 的 一 种 变 体 来 处 理 可 变 参数 列表 。 


#include <syslog.h> 
#include <stdarg.h> 
void vsyslog(int priority, const char *format, va_list arg); 


本 书 说 明 的 所 有 4 种 平台 都 提供 vsyslog, 但 Single UNIX Specification 中 并 不 包括 它 。 注 
意 ， 如 果 要 使 它 的 声明 对 应 用 程序 可 见 ， 可 能 需要 定义 一 个 额外 的 符号 , 例如， 在 FreeBSD PE 
义 BSD VISIBLE 或 在 Linux 中 定义 ”USE_BSD。 


KEK syslog 实现 将 使 消息 短 时 间 处 于 队列 中 。 如 果 在 此 段 时 间 中 有 重复 消息 到 达 ， 那 么 
syslog 守护 进程 不 会 把 它 写 到 日 志 记录 中 ， 而 是 会 打印 输出 一 条 类 似 于 “上 一 条 消息 重复 了 N 
次 ”的 消息 。 


13.5 ” 单 实例 守护 进程 


为 了 正常 运作 ， 某 些 守护 进程 会 实现 为 ， 在 任 一 时 刻 只 运行 该 守护 进程 的 一 个 副本 。 例 如 ， 
这 种 守护 进程 可 能 需要 排 它 地 访问 一 个 设备 。 对 cron THUMM a, 如 果 同 时 有 多 个 实例 运行 ， 
那么 每 个 副本 都 可 能 试图 开始 某 个 预定 的 操作 , 于 是 造成 该 操作 的 重复 执行 , 这 很 可 能 导致 出 错 。 

如 果 守 护 进 程 需要 访问 一 个 设备 ， 而 该 设备 驱动 程序 有 时 会 阻止 想 要 多 次 打开 /dev 目录 下 
相应 设备 节点 的 尝试 。 这 就 限制 了 在 一 个 时 刻 只 能 运行 守护 进程 的 一 个 副本 。 但 是 如 果 没 有 这 种 
设备 可 供 使 用 ， 那 么 我 们 就 需要 自行 处 理 。 

文件 和 记录 锁 机 制 为 一 种 方法 提供 了 基础 ， 该 方法 保证 一 个 守护 进程 只 有 一 个 副本 在 运行 。 
(文件 和 记录 锁 将 在 14.3 节 中 讨论 。) 如 果 每 一 个 守护 进程 创建 一 个 有 固定 名 字 的 文件 ， 并 在 该 文 
件 的 整体 上 加 一 把 写 锁 ， 那 么 上 只 允许 创建 一 把 这 样 的 写 锁 。 在 此 之 后 创建 写 锁 的 尝试 都 会 失败 ， 
这 向 后 续 守 护 进程 副本 指明 已 有 一 个 副本 正在 运行 。 

文件 和 记录 锁 提 供 了 一 种 方便 的 互 斥 机 制 。 如 果 守 护 进 程 在 一 个 文件 的 整体 上 得 到 一 把 写 
锁 ， 那 么 在 该 守护 进程 终止 时 ， 这 把 锁 将 被 自动 删除 。 这 就 简化 了 复原 所 需 的 处 理 ， 去 除了 对 以 
前 的 守护 进程 实例 需要 进行 清理 的 有 关 操 作 。 








s Xl 


图 13-6 所 示 的 函数 说 明了 如 何 使 用 文件 和 记录 锁 来 保证 只 运行 一 个 守护 进程 的 一 个 副本 。 





#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
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<unistd.h> 
<stdlib.h> 
«fcntl.h» 
«syslog.h» 
<string.h> 
<errno.h> 
<stdio.h> 
<sys/stat.h> 


#define LOCKFILE "/var/run/daemon.pid" 
#define LOCKMODE (S_IRUSR|S_IWUSR|S_IRGRP|S_IROTH) 


extern int lockfile(int); 


int 


already_running (void) 


fd = 


fd; 
buf [16]; 


open (LOCKFILE, O RDWR|O CREAT, LOCKMODE) ; 


if (fd « 0) f 


Syslog(LOG ERR, "can't open $s: %s", LOCKFILE, 


exit(1); 


if (lockfile(fd) < 0) { 
if (errno == EACCES || errno == EAGAIN) { 


) 


close(fd); 
return(1); 





strerror(errno) ); 


Syslog(LOG ERR, "can't lock $s: %s", LOCKFILE, strerror(errno)); 
exit (1); 


} 


ftruncate(fd, 0); 

sprintf (buf, "%ld", (long) getpid()); 
write(fd, buf, strlen(buf)+1); 
return (0); 





图 13-6 保证 只 运行 一 个 守护 进程 的 一 个 副本 

守护 进程 的 每 个 副本 都 将 试图 创建 一 个 文件 ， 并 将 其 进程 ID 写 到 该 文件 中 。 这 使 管理 人 员 
易于 标识 该 进程 。 如 果 该 文件 已 经 加 了 锁 ， 那么 lockfile 函数 将 失败 ，errno WAN EACCES 
或 EAGAIN， 图 13-6 中 的 函数 返回 1， 表 明 该 守护 进程 已 在 运行 。 否 则 将 文件 长 度 截 断 为 0， 将 
进程 ID 写 入 该 文件 ， 图 13-6 中 的 函数 返回 0。 

需要 将 文件 长 度 截断 为 0， 其 原因 是 之 前 的 守护 进程 实例 的 进程 ID 字符 串 可 能 长 于 调用 此 函数 的 
当前 进程 的 进程 ID 字符 串 。 例如 , 若 以 前 的 守护 进程 的 进程 ID 是 12345， 而 新 实例 的 进程 ID 是 9999, 
那么 将 此 进程 ID 写 入 文件 后 ， 在 文件 中 留 下 的 是 99995。 将 文件 长 度 截断 为 0 就 解决 了 此 问题 。 m 


13.6 ”守护 进程 的 惯例 
在 UNIX 系统 中 ， 守 护 进程 遵循 下 列 通用 惯例 。 
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若 守 护 进 程 使 用 锁 文 件 ， 那 么 该 文件 通常 存储 在 /var/run 目录 中 。 然 而 需要 注意 的 是 ， 
守护 进程 可 能 需要 具有 超级 用 户 权 限 才 能 在 此 目录 下 创建 文件 。 锁 文件 的 名 字 通 常 是 
name .pid， 其 中 ，name 是 该 守护 进程 或 服务 的 名 字 。 例 如 ，cron 守护 进程 锁 文件 的 名 
字 是 /var/run/crond.pid。 

若 守 护 进 程 支 持 配置 选项 ， 那 么 配置 文件 通常 存放 在 /etc 目录 中 。 配 置 文件 的 名 字 通 常 
是 name.conf, $}, name 是 该 守护 进程 或 服务 的 名 字 。 例 如 ，syslogd 守护 进程 的 
配置 文件 通常 是 /etc/syslog.conf。 

守护 进程 可 用 命令 行 启动 ， 但 通常 它们 是 由 系统 初始 化 脚本 之 一 ( /etc/rc* 或 
/etc/init.d/*) 启动 的 。 如果 在 守护 进程 终止 时 ， 应 当 自 动 地 重新 启动 它 ， 则 我 们 可 
在 /etc/inittab 中 为 该 守护 进程 包括 respawn 记录 项 , 这样，init 就 将 重新 启动 该 
守护 进程 。( 假 定 系统 使 用 System V 风格 的 init 命令 。) 

若 一 个 守护 进程 有 一 个 配置 文件 ， 那 么 当 该 守护 进程 启动 时 会 读 该 文件 ， 但 在 此 之 后 一 
般 就 不 会 再 查看 它 。 若 某 个 管理 员 更 改 了 配置 文件 ， 那 么 该 守护 进程 可 能 需要 被 停止 ， 

然后 再 启动 ， 以 使 配置 文件 的 更 改 生 效 。 为 避免 此 种 麻烦 ， 某 些 守 护 进程 将 捕捉 SIGHUP 
信号 ， 当 它们 接收 到 该 信号 时 ， 重 新 读 配置 文件 。 因 为 守护 进程 并 不 与 终端 相 结 合 ， 它 
们 或 者 是 无 控制 终端 的 会 话 首 进程 ， 或 者 是 孤儿 进程 组 的 成 员 ， 所 以 守护 进程 没有 理由 
期 望 接收 SIGHUP。 于 是 ， 守 护 进程 可 以 安全 地 重复 使 用 SIGHUP。 


a XA 


图 


13-7 所 示 的 程序 说 明了 守护 进程 可 以 重读 其 配置 文件 的 一 种 方法 。 该 程序 使 用 sigwait 


以 及 多 线程 ， 对 此 我 们 已 经 在 12.8 节 讨论 过 。 


#include "apue.h" 
#include <pthread.h> 
#include <syslog.h> 


sigset_t mask; 


extern int already running(void); 


void 


reread(void) 


{ 


} 


y € he 


void * 
thr_fn (void *arg) 


{ 


入 


int err, signo; 


for (;:) { 


err = sigwait(&mask, &signo); 

if (err != 0) { 
syslog(LOG_ERR, "sigwait failed"); 
exit(1); 


13.6 


Switch (signo) { 

case SIGHUP: 
syslog(LOG_INFO, "Re-reading configuration file"); 
reread (); 
break; 


case SIGTERM: 
syslog(LOG_INFO, "got SIGTERM; exiting"); 


exit(0); 


default: 
syslog(LOG INFO, "unexpected signal %d\n", signo); 


) 


return(0); 


(int argc, char *argv[]) 


int err; 
pthread t tid; 
char *cmd; 


struct sigaction sa; 


if ((cmd = strrchr(argv[0], '/')) == NULL) 
cmd - argv[0]; 

else 
cmd++; 


/* 

* Become a daemon. 
wf 

daemonize (cmd) ; 


/* 
* Make sure only one copy of the daemon is running. 
me 
if (already_running()) { 
syslog(LOG_ERR, "daemon already running"); 


exit (1); 
} 
/* 
* Restore SIGHUP default and block all signals. 
at 


sa.sa_handler = SIG_DFL; 

sigemptyset(&sa.sa mask); 

sa.sa flags = 0; 

if (sigaction(SIGHUP, &sa, NULL) < 0) 
err quit("$s: can't restore SIGHUP default"); 

sigfillset(&mask); 

if ((err = pthread sigmask(SIG BLOCK, &mask, NULL)) !- 0) 
err exit(err, "SIG BLOCK error"); 


守护 进程 的 惯例 


383 
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/* 

* Create a thread to handle SIGHUP and SIGTERM. 
Lf 

err = pthread_create(&tid, NULL, thr_fn, 0); 

if (err != 0) 


err_exit(err, “can't create thread"); 


/* 

* Proceed with the rest of the daemon. 
id 

PF ola. FY 

exit(0); 


图 13-7 守护 进程 重读 配置 文件 

该 程序 调用 了 图 13-1 中 的 daemonize 来 初始 化 守护 进程 。 从 该 函数 返回 后 ， 调 用 图 13-6 中 的 
already running 函数 以 确保 该 守护 进程 只 有 一 个 副本 在 运行 。 到达 这 一 点 时 ，SIGHUP 信和 号 仍 被 
忽略 ， 所 以 需 恢 复 对 该 信号 的 系统 默认 处 理 方式 ;否则 调用 sigwait 的 线程 决 不 会 见 到 该 信号 。 

如 同 对 多 线程 程序 所 推荐 的 那样 ， 阻 塞 所 有 信和 号， 然后 创建 一 个 线程 处 理 信 号 。 该 线程 的 唯 
一 工作 是 等 待 SIGHUP 和 SIGTERM。 当 接收 到 SIGHUP 信号 时 ， 该 线程 调用 reread 函数 重读 
它 的 配置 文件 。 当 它 接收 到 SIGTERM 信号 时 ， 会 记录 消息 并 退出 。 

回顾 图 10-1，SIGHUP 和 SIGTERM 的 默认 动作 是 终止 进程 。 因 为 我 们 阻塞 了 这 些 信号 ， 所 
以 当 SIGHUP 和 SIGTERM 的 其 中 一 个 被 发 送 到 守护 进程 时 ， 守 护 进程 不 会 消亡 。 作 为 替代 ， 调 
用 sigwait 的 线程 在 返回 时 将 指示 已 接收 到 该 信号 。 = 


加 实例 
并 非 所 有 守护 进程 都 是 多 线程 的 。 图 13-8 中 的 程序 说 明 一 个 单线 程 守护 进程 如 何 捕捉 
SIGHUP 并 重读 其 配置 文件 。 


#include "apue.h" 
#include <syslog.h> 
#include <errno.h> 


extern int lockfile(int); 
extern int already running(void); 


void 
reread (void) 
{ 
E a Sf 
} 


void 

sigterm(int signo) 

{ 
syslog(LOG_INFO, "got SIGTERM; exiting"); 
exit (0); 
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void 


sighup(int signo) 


{ 


Syslog(LOG INFO, "Re-reading configuration file"); 
reread (); 


(int argc, char *argv[]) 


char *cmd; 
struct sigaction sa; 


if ((cmd = strrchr(argv[0], '/')) == NULL) 
cmd = argv[0]; 

else 
cmd++; 

/* 

* Become a daemon. 

*/ 


daemonize (cmd) ; 


/* 
* Make sure only one copy of the daemon is running. 
wf 

if (already_running()) { 

syslog(LOG_ERR, "daemon already running"); 


exit(1); 
} 
/* 
* Handle signals of interest. 
* y 


sa.sa handler = sigterm; 

sigemptyset(&sa.sa mask); 

sigaddset(&sa.sa mask, SIGHUP); 

sa.sa flags = 0; 

if (sigaction(SIGTERM, &sa, NULL) < 0) { 
Syslog(LOG ERR, "can't catch SIGTERM: $s", strerror(errno)); 
exit (1); 

} 

sa.sa_handler = sighup; 

sigemptyset (&sa.sa_mask) ; 

sigaddset(&sa.sa mask, SIGTERM) ; 

sa.sa_flags = 0; 

if (sigaction(SIGHUP, &sa, NULL) < 0) { 
syslog(LOG ERR, "can't catch SIGHUP: %s", strerror(errno)); 


exit(1); 
} 
/* 
* Proceed with the rest of the daemon. 
uà 
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exit (0); 


图 13-8 ”守护 进程 重读 配置 文件 的 另 一 种 实现 
在 初始 化 守护 进程 后 ， 我 们 为 SIGHUP 和 SIGTERM 配置 了 信号 处 理 程序 。 可 以 将 重读 逻辑 
放 在 信号 处 理 程序 中 ， 也 可 以 只 在 信号 处 理 程序 中 设置 一 个 标志 ， 并 由 守护 进程 的 主线 程 完 成 所 
有 的 工作 。 e 


13.7 ”客户 进程 -服务 器 进程 模型 


守护 进程 常常 用 作 服务 器 进程 。 确实, 我 们 可 以 称 图 13-2 中 的 syslogd 进程 为 服务 器 进程 ， 
用 户 进程 〈 客 户 进程 ) 用 UNIX 域 数据 报 套 接 字 向 其 发 送 消息 。 

- 般 而 言 ， 服 务 器 进程 等 待 客户 进程 与 其 联系 ， 提 出 某 种 类 型 的 服务 要 求 。 图 13-2 中 ， 由 
syslogd 服务 器 进程 提供 的 服务 是 将 一 条 出 错 消 息 记 录 到 日 志文 件 中 。 

图 13-2 中 ， 客 户 进程 和 服务 器 进程 之 间 的 通信 是 单 向 的 。 客 户 进程 向 服务 器 进程 发 送 服 务 请 求 ， 
服务 器 进程 则 不 向 客户 进程 回 送 任何 消息 。 在 下 面 有 关 进 程 通信 的 几 章 中 , 我 们 将 见 到 大 量 客户 进程 和 
服务 器 进程 之 间 双 向 通信 的 实例 。 客 户 进程 向 服务 器 进程 发 送 请 求 , 服务 器 进程 则 向 客户 进程 回 送 应 答 。 

在 服务 器 进程 中 调用 fork 然后 exec 另 一 个 程序 来 向 客户 进程 提供 服务 是 很 常见 的 。 这 些 
服务 器 进程 通常 管理 着 多 个 文件 描述 符 : 通信 端点 、 配 置 文件 、 日 志文 件 和 类 似 的 文件 。 最 好 的 
情况 下 ， 让 子 进 程 中 的 这 些 文件 描述 符 保持 打开 状态 并 无 大 碍 ， 因 为 它们 很 可 能 不 会 被 在 子 进程 
中 执行 的 程序 所 使 用 ， 尤 其 是 那些 与 服务 器 端 无 关 的 程序 。 最 坏 情况 下 ， 保 持 它 们 的 打开 状态 会 
导致 安全 问题 一 一 被 执行 的 程序 可 能 有 一 些 恶 意 行 为 ， 如 更 改 服务 器 端 配置 文件 或 欺骗 客户 端 程 
序 使 其 认为 正在 与 服务 器 端 通信 ， 从 而 获取 未 授权 的 信息 。 

解决 此 问题 的 一 个 简单 方法 是 对 所 有 被 执行 程序 不 需要 的 文件 描述 符 设置 执行 时 关闭 


(close-on-exec) 标志 。 图 13-9 展示 了 一 个 可 以 用 来 在 服务 器 端 进程 中 执行 上 述 工作 的 函数 。 


#include "apue.h" 
#include «fcntl.h» 


int 
set_cloexec(int fd) 
{ 


int val; 


if ((val = fcntl(fd, F GETFD, 0)) < 0) 
return(-1); 


val |= FD CLOEXEC; /* enable close-on-exec */ 


return(fcntl(fd, F SETFD, val)); 
图 13-9 ”设置 执行 时 关闭 标志 
13.8 小结 
在 大 多 数 UNIX 系统 中 ， 守 护 进 程 是 一 直 运 行 的 。 为 了 初始 化 我 们 自己 的 进程 ， 使 之 作为 守 
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护 进程 运行 ， 需 要 一 些 审慎 的 思索 并 理解 第 9 章 中 说 明 的 进程 之 间 的 关系 。 本 章 开 发 了 一 个 可 由 
守护 进程 调用 的 能 对 其 自身 正确 初始 化 的 函数 。 

因为 守护 进程 通常 没有 控制 终端 ， 所 以 本 章 还 讨论 了 守护 进程 记录 出 错 消息 的 儿 种 方法 。 BRAN 
讨论 了 在 大 多 数 UNIX 系统 中 ， 守 护 进程 遵循 的 若干 惯例 ， 给 出 了 几 个 如 何 实现 某 些 惯例 的 实例 。 


习题 


13.1 从 图 13-2 可 以 推测 出 ， 直 接 调用 openlog 或 第 一 次 调用 syslog 都 可 以 初始 化 syslog 
设施 ， 此 时 一 定 要 打开 用 于 UNIX 域 数据 报 套 接 字 的 特殊 设备 文件 /dev/1og。 如 果 调 用 
openlog 前 ， 用 户 进程 (守护 进程 》 先 调用 了 chroot， 结 果 会 怎么 样 ? 

13.2 回顾 13.2 节 中 ps 输出 的 示例 。 唯 一 一 个 不 是 会 话 首 进程 的 用 户 层 守护 进程 是 rsyslogd 
进程 。 请 解释 为 什么 rsysloga 守护 进程 不 是 会 话 首 进程 。 

13.3 列 出 你 系统 中 所 有 有 效 的 守护 进程 ， 并 说 明 它 们 各 自 的 功能 。 

13.4 编写 一 段 程序 调用 图 13-1 中 daemonize 函数 。 调 用 该 函数 后 ， 它 已 成 为 守护 进程 ， 再 调 
FA getlogin (918.15 节 ) 查看 该 进程 是 否 有 登录 名 。 将 结果 打印 到 一 个 文件 中 。 
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14.1 引言 


本 章 涵盖 众多 概念 和 函数 ， 我 们 把 它们 统统 都 放 到 高 级 IO 下 讨论 : JE LO. ido Bi. 
VO 多 路 转 接 (select 和 poll 函数 )、 异 步 ITO、readv 和 writev 函数 以 及 存储 映射 UO 
(mmap). 328 15 章 和 第 17 章 中 的 进程 间 通 信和 以及 以 后 各 章 中 的 很 多 实例 都 要 使 用 本 章 所 描述 的 
概念 和 函数 。 


14.2 非 阻塞 IO 


10.5 节 中 曾 将 系统 调用 分 成 两 类 :“ 低 速 ” 系 统 调 用 和 其 他 。 低 速 系 统 调用 是 可 能 会 使 进程 
永远 阻塞 的 一 类 系统 调用 ， 包 括 : 
。 如 果 某 些 文件 类 型 (如 读 管道 、 终 端 设备 和 网 络 设 备 ) 的 数据 并 不 存在 ， 读 操作 可 能 会 
使 调用 者 永远 阻塞 ; 
。 如 果 数 据 不 能 被 相同 的 文件 类 型 立即 接受 (如 管道 中 无 空间 、 网 络 流 控 制 )， 写 操作 可 能 
会 使 调用 者 永远 阻塞 ; 
。 在 某 种 条 件 发 生 之 前 打开 某 些 文件 类 型 可 能 会 发 生 阻塞 〔〈 如 要 打开 一 个 终端 设备 ， 需 要 
先 等 待 与 之 连接 的 调制 解 调 器 应 答 ， 又 如 若 以 只 写 模式 打开 FIFO， 那 么 在 没有 其 他 进程 
已 用 读 模式 打开 该 FIFO 时 也 要 等 待 ); 
e 对 已 经 加 上 强制 性 记录 锁 的 文件 进行 读 写 ; 
e. 某 些 ioctl HEF: 
。 某 些 进程 间 通 信函 数 〈 见 第 15 章 )。 
我 们 也 曾 说 过 ， 虽 然 读 写 磁盘 文件 会 暂时 阻塞 调用 者 ， 但 并 不 能 将 与 磁盘 VO 有 关 的 系统 调 
用 视 为 “低速 ”。 
非 阻 塞 VO 使 我 们 可 以 发 出 open, read 和 write 这 样 的 VO 操作 ， 并 使 这 些 操作 不 会 永 
远 阻 塞 。 如 果 这 种 操作 不 能 完成 ， 则 调用 立即 出 错 返 回 ， 表 示 该 操作 如 继续 执行 将 阻塞 。 
对 于 一 个 给 定 的 描述 符 ， 有 两 种 为 其 指定 非 阻塞 IO 的 方法 。 
(OD 如 果 调 用 open 获得 描述 符 ， 则 可 指定 O NONBLOCK 标志 ( 见 3.3 节 )。 
(2) 对 于 已 经 打开 的 一 个 描述 符 ， 则 可 调用 fcnt1， 由 该 函数 打开 O_NONBLOCK 文件 状态 
标志 ( 见 3.14 节 )。 图 3-12 中 的 函数 可 用 来 为 一 个 描述 符 打 开 任 一 文件 状态 标志 。 
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System V 的 早期 版 本 使 用 标志 O_NDELAY 指定 非 阻塞 方式 。 在 这 些 System V 版 本 中 ， 如 果 无 数 
据 可 读 ， 则 read 返回 0。 而 UNIX 系统 又 常 将 read 的 返回 值 0 解释 为 文件 结束 ， 两 者 有 所 混淆 。 
POSIX.1 提供 了 一 个 非 阻塞 标志 ， 它 的 名 字 和 语义 都 与 O NDELAY 不 同 。 HK, 在 System V 的 早期 版 
本 中 ， 当 从 read 得 到 返回 值 0 时 ， 我 们 并 不 知道 该 调用 是 阻塞 了 还 是 遇 到 了 文件 尾 端 。POSIX.1 要 
求 ， 对 于 一 个 非 阻塞 的 描述 符 如 果 无 数据 可 读 ， 则 read 返回 -1，errno 被 设置 为 EAGAIN, System V 
派生 的 某 些 平台 既 支持 较 旧 的 O_NDELRY， 又 支持 POSIX.1 的 O_NONBLOCK， 但 在 本 书 的 实例 中 只 使 
用 POSIX.1 规定 的 特征 。 较 旧 的 O_NDELAY 只 是 为 了 向 后 兼容 ， 不 应 在 新 应 用 程序 中 使 用 。 

4.3BSD 为 fcnt1l 提供 了 FNDELAY 标志 ,其 语义 也 稍 有 区 别 。 它 不 只 影响 描述 符 的 文件 状态 
标志 ， 还 将 终端 设备 或 套 接 字 的 标志 更 改 成 非 阻 塞 的 ， 因 此 不 仅 影响 共享 同一 文件 表 项 的 用 户 ， 
而 且 对 终端 或 套 接 字 的 所 有 用 户 起 作用 (4.3BSD 非 阻塞 IO 只 对 终端 和 套 接 字 起 作用 )， 另 外 ， 
如 果 对 一 个 非 阻塞 描述 符 的 操作 不 能 无 阻塞 地 完成 ， 那 么 4.3BSD 返回 EWOULDBLOCK。 现今 , 基 
F BSD 的 系统 提供 POSIX.1 的 O_NONBLOCK 标志 ， 并 且 将 EWOULDBLOCK 定义 为 与 POSIX.1 的 
EAGAIN 相同 。 这 些 系 统 提供 与 其 他 POSIX 兼容 系统 相 一 致 的 非 阻塞 语义 : 文件 状态 标志 的 更 改 
影响 同一 文件 表 项 的 所 有 用 户 ， 但 与 通过 其 他 文件 表 项 对 同一 设备 的 访问 无 关 。 


a KA 


图 14-1 中 的 程序 是 一 个 非 阻 塞 IO 的 实例 ， 它 从 标准 输入 读 500 000 字 节 ， 并 试图 将 它们 写 到 标准 
输出 上 。 该 程序 先 将 标准 输出 设置 为 非 阻塞 的 ， 然 后 用 for 循环 进行 输出 ， 每 次 write 调用 的 结果 都 
在 标准 错误 上 打印 。 函 数 clr_f1 类 似 于 图 3-12 中 的 set_f1。 这 个 新 函数 清除 1 个 或 多 个 标志 位 。 


#include "apue.h" 
#include <errno.h> 
#include «fcntl.h» 


char buf [500000]; 


int 

main (void) 

{ 
int ntowrite, nwrite; 
char *ptr; 


ntowrite = read(STDIN FILENO, buf, sizeof (buf)); 
fprintf(stderr, "read $d bytes Nn", ntowrite); 


set fl(STDOUT FILENO, O NONBLOCK); /* set nonblocking */ 


ptr = buf; 

while (ntowrite » 0) ( 
errno - 0; 
nwrite = write(STDOUT FILENO, ptr, ntowrite); 
fprintf(stderr, "nwrite = %d, errno = %d\n", nwrite, errno); 


if (nwrite > 0) { 
ptr += nwrite; 
ntowrite -= nwrite; 
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clr fl(STDOUT FILENO, O NONBLOCK); /* clear nonblocking */ 


exit(0); 


图 14-1 长 的 非 阻塞 write 
若 标准 输出 是 普通 文件 ， 则 可 以 期 望 write 只 执行 一 次 。 


$ 1s -1 /etc/services 打印 文件 长 度 
-rw-r--r-- 1 root 677959 gun 23 2009 /etc/services 

$ ./a.out < /etc/services > temp.file 先 试 一 个 普通 文件 
read 500000 bytes 

nwrite = 500000, errno = 0 一 次 写 

$ ls -1 temp.file 检验 输出 文件 长 度 
-rw-rw-r-- 1 sar 500000 Apr 1 13:03 temp.file 


但 是 ， 若 标准 输出 是 终端 ， 则 期 望 write 有 时 返回 小 于 500000 的 一 个 数字 ， 有 时 返回 错误 。 下 
面 是 运行 结果 : 
$ ./a.out < /etc/services 2>stderr.out 终端 至 输出 
大 量 输出 至 终端 …… 


$ cat stderr.out 
read 500000 bytes 


nwrite = 999, errno = 0 

nwrite = -1, errno = 35 

nwrite = -1, errno = 35 

nwrite = -1, errno = 35 

nwrite = -1, errno = 35 

nwrite = 1001, errno = 0 

nwrite = -1, errno = 35 

nwrite = 1002, errno = 0 

nwrite = 1004, errno = 0 

nwrite = 1003, errno = 0 

nwrite = 1003, errno = 0 

nwrite = 1005, errno = 0 

nwrite = -1, errno = 35 61 个 此 类 错误 
nwrite = 1006, errno = 0 

nwrite = 1004, errno = 0 

nwrite = 1005, errno = 0 

nwrite = 1006, errno = 0 

nwrite = -1, errno = 35 108 个 此 类 错误 


nwrite = 1006, errno = 0 


nwrite = 1005, errno = 

nwrite = 1005, errno = 

nwrite = -1, errno = 35 681 个 此 类 错误 
等 等 

nwrite = 347, errno = 0 


在 该 系统 上 ，errno ff 35 对 应 的 是 EAGAIN。 终 端 驱 动 程序 一 次 能 接受 的 数据 量 随 系统 而 
变 。 具 体 结果 还 会 因 登 录 系 统 时 所 使 用 的 方式 的 不 同 而 不 同 : 在 系统 控制 台 上 登录 、 在 硬 接线 的 
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终端 上 登录 或 用 伪 终 端 在 网 络 连接 上 登录 。 如 果 你 在 终端 上 运行 一 个 窗口 系统 ， 那 么 也 是 经 由 伪 
终端 设备 与 系统 交互 。 x 


在 此 实例 中 ， 程 序 发 出 了 9000 多 个 write 调用 , 但 是 只 有 500 个 真正 输出 了 数据 ， 其 余 的 
都 只 返回 了 错误 。 这 种 形式 的 循环 称 为 轮 询 ， 在 多 用 户 系 统 上 用 它 会 浪费 CPU 时 间 。14.4 节 将 介 
绍 非 阻塞 描述 符 的 VO 多 路 转 接 ， 这 是 进行 这 种 操作 的 一 种 比较 有 效 的 方法 。 
有 时 ， 可 以 将 应 用 程序 设计 成 使 用 多 线程 的 〈 见 第 11 章 )， 从 而 避免 使 用 非 阻塞 JO。 如 若 我 们 
能 在 其 他 线程 中 继续 进行 ， 则 可 以 允许 单个 线程 在 VO 调用 中 阻塞 。 这 种 方法 有 时 能 简化 应 用 程序 的 
Beit O58 21 章 )， 但 是 ， 线 程 间 同 步 的 开销 有 时 却 可 能 增加 复杂 性 ， 于 是 导致 得 不 偿 失 的 后 果 。 484 
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当 两 个 人 同时 编辑 一 个 文件 时 ， 其 后 果 将 如 何 呢 ? 在 大 多 数 UNIX 系统 中 ， 该 文件 的 最 后 状 
态 取决 于 写 该 文件 的 最 后 一 个 进程 。 但 是 对 于 有 些 应 用 程序 ， 如 数据 库 ， 进 程 有 时 需要 确保 它 正 
在 单独 写 一 个 文件 。 为 了 向 进程 提供 这 种 功能 ， 商 用 UNIX 系统 提供 了 记录 锁 机 制 。( 第 20 章 包 
含 了 使 用 记录 锁 的 数据 库 函数 库 。) 

记录 锁 (record locking) 的 功能 是 : 当 第 一 个 进程 正在 读 或 修改 文件 的 某 个 部 分 时 ， 使 用 记 
录 锁 可 以 阻止 其 他 进程 修改 同一 文件 区 。 对 于 UNIX 系统 而 言 ,“ 记 录 ” 这 个 词 是 一 种 误 用 ， 因 
为 UNIX 系统 内 核 根本 没有 使 用 文件 记录 这 种 概念 。 一 个 更 适合 的 术语 可 能 是 字 节 范围 锁 
(byte-range locking)， 因 为 它 锁 定 的 只 是 文件 中 的 一 个 区 域 (也 可 能 是 整个 文件 )。 

1. 历史 

对 早期 UNIX 系统 的 其 中 一 个 批评 是 它们 不 能 用 来 运行 数据 库 系统 ， 其 原因 是 这 些 系 统 不 支 
持 对 部 分 文件 加 锁 。 在 UNIX 系统 寻找 进入 商用 计算 环境 的 途径 时 ， 很 多 系统 开发 小 组 以 各 种 不 
同方 式 增加 了 对 记录 锁 的 支持 。 

早期 的 伯克利 版 本 只 支持 flock 函数 。 该 函数 只 能 对 整个 文件 加 锁 ， 不 能 对 文件 中 的 一 Lc 

SVR3 通过 font1 函数 增加 了 记录 锁 功 能 。 在 此 基础 上 构造 了 lockt 函数 ， 它 提供 了 - 
简化 的 接口 。 这 些 函 数 允 许 调用 者 对 一 个 文件 中 任意 字 节 数 的 区 域 加 锁 ， 长 至 整个 文件 ， ane 
件 中 的 一 个 字 节 。 

POSIX.1 标准 的 基础 是 fcnt1 方法 。 图 14-2 列 出 了 各 种 系统 提供 的 不 同形 式 的 记录 锁 。 注 
意 ，Single UNIX Specification 在 其 XSI 扩展 中 包括 了 lockf. 


sys | 
FreeBSD 8.0 


Linux 3.2.0 
Mac OS X 10.6.8 
Solaris 10 





图 14-2 各 种 UNIX 系统 支持 的 记录 锁 形式 
本 节 最 后 部 分 将 说 明 建 议 性 锁 和 强制 性 锁 之 间 的 区 别 。 本 书 只 介绍 POSIX.1 的 fcnt1 Bt. 
记录 锁 是 1980 年 由 John Bass 最 早 添加 到 V7 上 的 。 内 核 中 相应 的 系统 调用 入 口 项 是 名 为 
locking 的 函数 。 此 函数 提供 了 强制 性 记录 锁 功 能 ， 它 被 用 在 很 多 System IIL 版 本 中 。Xenix 系统 采用 
了 此 函数 ， 某 些 基 于 Intel 的 System V 派生 版 本 ， 如 OpenServer 5， 在 Xenix 兼容 库 中 仍旧 支持 该 函数 。 
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2. fentl 记录 锁 
3.14 节 中 已 经 给 出 了 font] 函数 的 原型 ， 为 了 叙说 方便 ， 这 里 再 重复 一 次 。 








#include «fcntl.h» 


az 


上 已 经 有 一 把 或 多 把 读 锁 , 则 不 能 在 该 字 节 上 再 加 写 锁 ; 
如 果 在 一 个 字 节 上 已 经 有 一 把 独占 性 写 锁 ， 则 不 能 再 对 
它 加 任何 读 锁 。 在 图 14-3 中 示 出 了 这 些 兼容 性 规则 。 

上 面 说 明 的 兼容 性 规则 适用 于 不 同 进程 提出 的 ”当前 区 域 
锁 请 求 ， 并 不 适用 于 单个 进程 提出 的 多 个 锁 请 求 。 如 
果 一 个 进程 对 一 个 文件 区 间 已 经 有 了 一 把 锁 , 后 来 该 
进程 又 企图 在 同一 文件 区 间 再 加 一 把 锁 ， 那 么 新 锁 将 





int fcntl(int fd, int cmd, .../* struct flock *flockptr */); 
返回 值 : 若 成 功 ， 依 赖 于 cmd C FO, EW, WE- 








对 于 记录 锁 ，cmqd iÈ F GETLK. F SETLK 或 F_SETLKW。 第 三 个 参数 (我 们 将 调用 flockptr) 


一 个 指向 flock 结构 的 指针 。 


struct flock { 


short 1l type; /* F RDLCK, F WRLCK, or F UNLCK */ 
short 1 whence; /* SEEK SET, SEEK CUR, or SEEK END */ 
off t Ll start; /* offset in bytes, relative to 1 whence */ 
off t l len; /* length, in bytes; 0 means lock to EOF */ 
pid t l pid; /* returned with F GETLK */ 

对 flock 结构 说 明 如 下 。 


所 希望 的 锁 类 型 : F_RDLCK (共享 读 锁 )、F_WRLCK (独占 性 写 锁 ) 或 F_UNLCK (解锁 
一 个 区 域 )。 

要 加 锁 或 解锁 区 域 的 起 始 字 节 偏 移 量 (1 start 和 1 whence)。 

区 域 的 字 节 长 度 (1_len). 

进程 的 ID (1_pid) 持 有 的 锁 能 阻塞 当前 进程 ( 仅 由 F_GETLK 返回 )。 


关于 加 锁 或 解锁 区 域 的 说 明 还 要 注意 下 列 儿 项 规则 。 


省 定 区 域 起 始 偏 移 量 的 两 个 元 素 与 1seek 函数 CA 3.6 节 ) 中 最 后 两 个 参数 类 似 。1_whence 
可 选用 的 值 是 SEEK_SET、SEEK_CUR 或 SEEK_END。 

锁 可 以 在 当前 文件 尾 端 处 开始 或 者 越过 尾 端 处 开始 ， 但 是 不 能 在 文件 起 始 位 置 之 前 开始 。 
如 车 1_len 为 0， 则 表示 锁 的 范围 可 以 扩展 到 最 大 可 能 偏 移 量 。 这 意味 着 不 管 向 该 文件 
中 追加 写 了 多 少数 据 ， 它 们 都 可 以 处 于 锁 的 范围 内 不必 猜测 会 有 多 少 字 节 被 追加 写 到 
了 文件 之 后 )， 而 且 起 始 位 置 可 以 是 文件 中 的 任意 一 个 位 置 。 

为 了 对 整个 文件 加 锁 ， 我 们 设置 ]_start 和 1_whence 指向 文件 的 起 始 位 置 ， 并 且 指 定 
KÆ Glen) 为 0。( 有 多 种 方法 可 以 指定 文件 起 始 处 ,但 常用 的 方法 是 将 1_start fü 
定 为 0，1_whence 指定 为 SEEK_SET。) 





上 面 提 到 了 两 种 类 型 的 锁 ， 共 享 读 锁 I type WL RDLCKO 和 独占 性 写 锁 (L_WRLCK)。 基 本 规 
则 是 : 任意 多 个 进程 在 一 个 给 定 的 字 节 上 可 以 有 一 把 共享 的 读 锁 , 但 是 在 一 个 给 定 字 节 上 只 能 有 一 个 进 
程 有 一 把 独占 写 锁 。 进 一 步 而 言 ， 如 果 在 一 个 给 定 字 节 Wk 


























图 14-3 不 同类 型 锁 彼 此 之 间 的 兼容 性 
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替换 已 有 锁 。 因 此 ， 若 一 进程 在 某 文件 的 16 一 32 字 节 区 间 有 一 把 写 锁 ， 然 后 又 试图 在 16 一 32 € 
节 区 间 加 一 把 读 锁 ， 那 么 该 请 求 将 成 功 执行 ， 原 来 的 写 锁 会 被 替换 为 读 锁 。 

加 读 锁 时 ， 该 描述 符 必须 是 读 打 开 。 加 写 锁 时 ， 该 描述 符 必须 是 写 打 开 。 

下 面 说 明 一 下 fcntl 函数 的 3 种 命令 。 

F_GETLK 判断 由 flockptr 所 描述 的 锁 是 否 会 被 另外 一 把 锁 所 排斥 〈 阻 塞 )。 如 果 存 在 一 
把 锁 ， 它 阻止 创建 由 flockptr 所 描述 的 锁 ， 则 该 现 有 锁 的 信息 将 重 写 flockptr 
指向 的 信息 。 如 果 不 存 在 这 种 情况 ， 则 除了 将 1 type 设置 为 F_UNLCK 之 外 ， 
flockptr 所 指向 结构 中 的 其 他 信息 保持 不 变 。 

F_SETLK 设置 由 flockptr 所 描述 的 锁 。 如 果 我 们 试图 获得 一 把 读 锁 Cl type 为 
F_RDLCK) 或 写 锁 (1 type 为 F_WRLCK), 而 兼容 性 规则 阻止 系统 给 我 们 这 
把 锁 ， 那 么 fcnt1 会 立即 出 错 返回 ， 此 时 errno 设置 为 EACCES 或 EAGAIN。 


虽然 POSIX.1 允许 实现 返回 这 两 种 出 错 代码 中 的 任何 一 种 ， 但 本 书 说 明 的 4 种 实现 在 锁 
请 求 不 能 得 到 满足 时 ， 都 返回 EAGAIN。 


此 命令 也 用 来 清除 由 flockptr 指定 的 锁 (1 type 为 F_UNLCK)。 487 
F_SETLKW ”这 个 命令 是 F_SETLK 的 阻塞 版 本 (命令 名 中 的 W 表 示 等 待 (wait))。 如 果 所 
请 求 的 读 锁 或 写 锁 因 另 一 个 进程 当前 已 经 对 所 请 求 区 域 的 某 部 分 进行 了 加 锁 
而 不 能 被 授予 ， 那 么 调用 进程 会 被 置 为 休眠 。 如 果 请 求 创建 的 锁 已 经 可 用 ， 
或 者 休眠 由 信号 中 断 ， 则 该 进程 被 唤醒 。 
应 当 了 解 , FA F_GETLK 测试 能 否 建立 一 把 锁 ， 然后 用 F_SETLK 或 F_SETLKW 企图 建立 那 把 锁 ， 
这 两 者 不 是 一 个 原子 操作 。 因 此 不 能 保证 在 这 两 次 fcntl 调用 之 间 不 会 有 另 一 个 进程 插入 并 建立 一 
把 相同 的 锁 。 如 果 不 希望 在 等 待 锁 变 为 可 用 时 产生 阻塞 ， 就 必须 处 理由 了 _SETLK 返回 的 可 能 的 出 错 。 
注意 ，POSIX.1 并 没有 说 明 在 下 列 情况 下 将 发 生 什 么 : 一 个 进程 在 某 个 文件 的 一 个 区 间 上 设 
置 了 一 把 读 锁 ， 第 二 个 进程 在 试图 对 同一 文件 区 间 加 一 把 写 锁 时 阻塞 ， 然 后 第 三 个 进程 则 试图 在 
同一 文件 区 间 上 得 到 另 一 把 读 锁 。 如 果 第 三 个 进程 只 是 因为 读 区 间 已 有 一 把 读 锁 ， 而 被 允许 在 该 
区 间 放 置 另 一 把 读 锁 ， 那 么 这 种 实现 就 可 能 会 使 希望 加 写 锁 的 进程 俄 死 。 因 此 ， 当 对 同一 区 间 加 
另 一 把 读 锁 的 请 求 到 达 时 ， 提 出 加 写 锁 而 阻塞 的 进程 需 等 待 的 时 间 延 长 了 。 如 果 加 读 锁 的 请 求 来 
得 很 频繁 ， 使 得 该 文件 区 间 始 终 存 在 一 把 或 几 把 读 锁 ， 那 么 欲 加 写 锁 的 进程 就 将 等 待 很 长 时 间 。 
在 设置 或 释放 文件 上 的 一 把 锁 时 ， 系 统 按 要 求 组 合 或 分 裂 相 邻 区 。 例 如 ， 若 第 100—199 F 
节 是 加 锁 的 区 ， 需 解锁 第 150 字 节 ， 则 内 核 将 维持 两 把 锁 ， 一 把 用 于 第 100—149 字 节 ， 另 一 把 
用 于 第 151 一 199 图 14-4 s 了 这 种 情况 下 的 字 节 范 围 锁 。 





100 199 100 149 151 199 


对 第 100 —199 字 节 加 锁 后 的 文件 对 第 150 字 节 解锁 后 的 文件 
图 14-4 文件 字 节 范围 锁 488 
假定 我 们 又 对 第 150 字 节 加 锁 ， 那 么 系统 将 会 再 把 3 个 相 邻 的 加 锁 区 合并 成 一 个 区 (第 100 一 
199 字 节 )。 其 结果 如 图 14-4 中 的 第 一 个 图 所 示 ， 又 跟 开 始 的 时 候 一 样 了 。 
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aAA: 请 求 和 释放 一 把 锁 


为 了 避免 每 次 分 配 flock 结构 ， 然 后 又 填 入 各 项 信息 ， 可 以 用 图 14-5 所 示 的 程序 中 的 函数 
lock_reg 来 处 理 所 有 这 些 细节 。 


#include "apue.h" 
#include «fcntl.h» 


int 
lock_reg(int fd, int cmd, int type, off t offset, int whence, off t len) 
{ 

struct flock lock; 


lock.l type = type; /* F_RDLCK, F_WRLCK, F_UNLCK */ 

lock.l start = offset; /* byte offset, relative to 1 whence */ 
lock.l whence - whence; /* SEEK SET, SEEK CUR, SEEK END */ 
lock.l len = len; /* #bytes (0 means to EOF) */ 


return(fcntl(fd, cmd, &lock)); 


图 14-5 加 锁 或 解锁 一 个 文件 区 域 的 函数 


因为 大 多 数 锁 调用 是 加 锁 或 解锁 一 个 文件 区 域 ( 命 令 F_GETLK 很 少 使 用 )， 故 通常 使 用 下 列 
5 个 宏 中 的 一 个 ， 这 5 个 宏 都 定义 在 apue.h 中 〈 见 附录 B). 


#define read_lock(fd,offset,whence,len) \ 

lock reg((fd), F SETLK, F RDLCK, (offset), (whence), (len)) 
#define readw lock(fd,offset,whence,len) \ 

lock reg((fd), F_SETLKW, F RDLCK, (offset), (whence), (len)) 
#define write lock(fd,offset,whence,len) \ 

lock reg((fd), F SETLK, F WRLCK, (offset), (whence), (len)) 
#define writew lock(fd,offset,whence,len) \ 

lock reg((fd), F SETLKW, F WRLCK, (offset), (whence), (len)) 
#define un lock(fd,offset,whence,len) \ 

lock reg((fd), F SETLK, F UNLCK, (offset), (whence), (len)) 


我 们 有 目的 地 用 与 1seek 函数 同样 的 顺序 定义 了 这 些 宏 中 的 前 3 个 参数 。 E 
s XU: 测试 一 把 锁 
图 14-6 中 定义 了 一 个 函数 lock_test， 我 们 将 用 它 测试 一 把 锁 。 


#include "apue.h" 
#include «fcntl.h» 





pid t 
lock test(int fd, int type, off t offset, int whence, off t len) 
( 

struct flock lock; 


lock.l type = type; /* F RDLCK or F WRLCK */ 
lock.l start = offset; /* byte offset, relative to l whence */ 
lock.l whence = whence; /* SEEK SET, SEEK CUR, SEEK END */ 


lock.l len = len; /* #bytes (0 means to EOF) */ 
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if (fcntl(fd, F_GETLK, &lock) < 0) 
err sys("fcntl error"); 


if (lock.l type -- F UNLCK) 
return(0); /* false, region isn't locked by another proc */ 
return(lock.l pid); /* true, return pid of lock owner */ 


图 14-6 ”测试 一 个 锁 条 件 的 函数 
如 果 存 在 一 把 锁 ， 它 阻塞 由 参数 指定 的 锁 请 求 ， 则 此 函数 返回 持 有 这 把 现 有 锁 的 进程 的 进程 


ID， 否 则 此 函数 返回 0。 通常 用 下 面 两 个 宏 来 调用 此 函数 (它们 也 定义 在 apue.h 中 )。 
#define is read lockable(fd, offset, whence, len) \ 
(lock test((fd), F RDLCK, (offset), (whence), (len)) == 0) 
#define is_write_lockable(fd, offset, whence, len) \ 
(lock test((fd), F WRLCK, (offset), (whence), (len)) == 0) 


注意 ， 进 程 不 能 使 用 lock test 函数 测试 它 自己 是 否 在 文件 的 某 一 部 分 持 有 一 把 锁 。 
F GETLK 命令 的 定义 说 明 ， 返 回信 息 指示 是 否 有 现 有 的 锁 阻 止 调用 进程 设置 它 自己 的 锁 。 因 为 
F_SETLK fil F_SETLKW 命令 总 是 替换 调用 进程 现 有 的 锁 〈 若 已 存在 )， 所 以 调用 进程 决 不 会 阻塞 
在 自己 持 有 的 锁 上 ， 于 是 ，F_GETLK 命令 决 不 会 报告 调用 进程 自己 持 有 的 锁 。 m 


aX: 死 锁 


如 果 两 个 进程 相互 等 待 对 方 持 有 并 且 不 释放 锁定 ) 的 资源 时 ， 则 这 两 个 进程 就 处 于 死 锁 状 
态 。 如 果 一 个 进程 已 经 控制 了 文件 中 的 一 个 加 锁 区 域 ， 然 后 它 又 试图 对 另 一 个 进程 控制 的 区 域 加 
锁 ， 那 么 它 就 会 休眠 ， 在 这 种 情况 下 ， 有 发 生死 锁 的 可 能 性 。 

图 14-7 所 示 的 程序 给 出 了 一 个 死 锁 的 例子 。 子 进程 对 第 0 字 节 加 锁 ， 父 进程 对 第 1 字 节 加 锁 。 然 
后 ， 它 们 中 的 每 一 个 又 试图 对 对 方 已 经 加 锁 的 字 节 加 锁 。 在 该 程序 中 使 用 了 8.9 节 中 介绍 的 父 进 程 和 子 
进程 同步 例 程 (TELL_xxx 和 WAIT_xxx)， 以 便 每 个 进程 能 够 等 待 另 一 个 进程 获得 它 设 置 的 第 一 把 锁 。 


#include "apue.h" 
#include «fcntl.h» 


static void 
lockabyte (const char *name, int fd, off t offset) 490 
{ 
if (writew_lock(fd, offset, SEEK_SET, 1) < 0) 
err_sys("%s: writew_lock error", name); 
printf ("%s: got the lock, byte $11dMn", name, (long long) offset); 
} 


int 

main (void) 

{ 
ipt fd; 
pid t pid; 


/* 
* Create a file and write two bytes to it. 
S4 
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if ((fd = creat("templock", FILE MODE)) < 0) 
err syS("creat error"); 

if (write(fd, "ab", 2) t= 2) 
err sys("write error"); 


TELL WAIT(); 
if ((pid = fork()) « 0) { 
err sys("fork error"); 
) else if (pid -- O) ( /* child */ 
lockabyte("child", fd, 0); 
TELL PARENT (getppid()); 
WAIT PARENT(); 
lockabyte("child", fd, 1); 
} else 1 /* parent */ 
lockabyte("parent", fd, 1); 
TELL CHILD (pid); 
WAIT CHILD(); 
lockabyte("parent", fd, 0); 
) 
exit(0); 


图 14-7 死 锁 检 测 实例 
运行 图 14-7 中 的 程序 得 到 ; 
$ ./a.out 
parent: got the lock, byte 1 
child: got the lock, byte 0 
parent: writew lock error: Resource deadlock avoided 
child: got the lock, byte 1 


检测 到 死 锁 时 ， 内 核 必须 选择 一 个 进程 接收 出 错 返回 。 在 本 实例 中 ,选择 了 父 进程 ， 但 这 是 一 个 实 
现 细节 。 在 某 些 系统 上 ， 子 进程 总 是 接 到 出 错 信息 ， 在 另 一 些 系统 上 ， 父 进程 总 是 接 到 出 错 信息 。 在 某 
些 系统 上 ， 当 试图 使 用 多 把 锁 时 ， 有 时 是 子 进程 接 到 出 错 信息 ， 有 时 则 是 父 进程 接 到 出 错 信息 。 — m 
3， 锁 的 隐 含 继承 和 释放 
关于 记录 锁 的 自动 继承 和 释放 有 3 条 规则 。 
(1) 锁 与 进程 和 文件 两 者 相关 联 。 这 有 两 重 含 义 : 第 一 重 很 明显 ， 当 一 个 进程 终止 时 ， 它 所 
建立 的 锁 全 部 释放 ; 第 二 重 则 不 太 明显 ， 无 论 一 个 描述 符 何 时 关闭 ， 该 进程 通过 这 一 描述 符 引用 
的 文件 上 的 任何 一 把 锁 都 会 释放 〈 这 些 锁 都 是 该 进程 设置 的 )。 这 就 意味 着 ， 如 果 执行 下 列 4 步 : 


fdl = open(pathname, ...); 
read_lock(fdl, ...); 

fd2 = dup(fd1l); 

close (fd2) ; 


则 在 close (fd2) 后 ， 在 fdl 上 设置 的 锁 被 释放 。 如 果 将 dup 替换 为 open， 其 效果 也 一 样 : 


fdl = open (pathname, ...); 


read lock(fdl, ...); 
fd2 = open(pathname, ...) 
close(fd2); 


(2) Hi fork 产生 的 子 进程 不 继承 父 进程 所 设置 的 锁 。 这 意味 着 ， 若 一 个 进程 得 到 一 把 锁 ， 
然后 调用 fork， 那 么 对 于 父 进程 获得 的 锁 而 言 ， 子 进程 被 视 为 另 一 个 进程 。 对 于 通过 fork 从 
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父 进程 处 继承 过 来 的 描述 符 ， 子 进程 需要 调用 fcntl 才能 获得 它 自 己 的 锁 。 这 个 约束 是 有 道理 
的 ， 因 为 锁 的 作用 是 阻止 多 个 进程 同时 写 同 一 个 文件 。 如 果子 进程 通过 fork 继承 父 进 程 的 锁 ， 
则 父 进 程 和 子 进程 就 可 以 同时 写 同一 个 文件 。 

(3) 在 执行 exec 后 ， 新 程序 可 以 继承 原 执 行程 序 的 锁 。 但 是 注意 ， 如 果 对 一 个 文件 描述 符 设 置 
了 执行 时 关闭 标志 ， 那 么 当 作 为 exec 的 一 部 分 关闭 该 文件 描述 符 时 ， 将 释放 相应 文件 的 所 有 锁 。 

4. FreeBSD 实现 

先 简要 地 观察 FreeBSD 实现 中 使 用 的 数据 结构 。 这 会 帮助 我 们 进一步 理解 记录 锁 的 自动 继承 
和 释放 的 第 一 条 规则 : 锁 与 进程 和 文件 两 者 相关 联 。 

考虑 一 个 进程 ， 它 执行 下 列 语句 (忽略 出 错 返 回 )。 


fdl = open(pathname, ...); 


write lock(fdl, 0, SEEK SET, 1); /* parent write locks byte 0 */ 
if ((pid = fork()) > 0) { /* parent */ 

fd2 = dup(fdl); 

fd3 = open(pathname, ...); 


} else if (pid == 0) { 
read lock(fdl, 1, SEEK SET, 1); /* child read locks byte 1 */ 
} 











































































































































pause (); 
图 14-8 显示 了 父 进程 和 子 进 程 暂停 CHT pause OO 后 的 数据 结构 情况 。 
父 进 程 表 项 
文件 表 项 
4 
fd 文件 指针 当前 文件 偏 移 量 
fa v 节点 指针 
fd2: “| 一 
fd3: E 
文件 状态 标志 
当前 文件 偏 移 量 
子 进程 表 项 V 节 点 指针 — 
fd 
Ras ”文件 指针 struct lockf 
fdl: = 3 
fan 镇 的 头 部 
ES 
— lockf_entry jj% 
hoe struct lockf entry 
链接 0 = 链接 
标志 标志 
起 始 偏 移 量 起 始 偏 移 量 
结束 偏 移 量 结束 偏 移 量 
lock_owner 指针 lock_owner 指针 
struct lock_owner struct lock_owner 
所 有 者 信息 所 有 者 信息 
— HRID — T3ERID | 














14-8. 关于 记录 锁 的 FreeBSD 数据 结构 
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前 面 已 经 给 出 了 open. fork 以 及 dup 调用 后 的 数据 结构 〔( 见 图 3-9 和 图 8-2)。 有 了 记录 
锁 后 , 在 原来 的 这 些 图 上 新 加 了 lockf 结构 , 它们 由 i 节点 结构 开始 相互 链接 起 来 。 每 个 1ockf 
结构 描述 了 一 个 给 定 进程 的 一 个 加 锁 区 域 (由 偏 移 量 和 长 度 定义 的 )。 图 中 显示 了 两 个 lockf 结 
构 ， 一 个 是 由 父 进 程 调用 write lock 形成 的 ， 另 一 个 则 是 由 子 进程 调用 read_lock 形成 的 。 
每 一 个 结构 都 包含 了 相应 的 进程 ID。 

在 父 进程 中 , 关闭 fdl, fd2 或 £d3 中 的 任意 一 个 都 将 释放 由 父 进程 设置 的 写 锁 。 在 关闭 这 
3 个 描述 符 中 的 任意 一 个 时 ， 内 核 会 从 该 描述 符 所 关联 的 i 节 点 开始 ， 逐 个 检查 1ockf 链接 表 中 
的 各 项 ， 并 释放 由 调用 进程 持 有 的 各 把 锁 。 内 核 并 不 清楚 〈 也 不 关心 ) 父 进程 是 用 这 3 个 描述 中 
的 哪 一 个 来 设置 这 把 锁 的 。 


s I 
在 图 13-6 所 示 的 程序 中 , 我 们 了 解 到 ， 守 护 进程 可 用 一 把 文件 锁 来 保证 只 有 该 守护 进程 的 唯 


一 副本 在 运行 。 图 14-9 展示 了 lockfile 函数 的 实现 ， 守 护 进 程 可 用 该 函数 在 文件 上 加 写 锁 。 


#include <unistd.h> 
#include «fcntl.h» 


int 
lockfile(int fd) 
{ 
struct flock fl; 


fl.l type = F WRLCK; 

fl.l start = 0; 

fl.l whence = SEEK SET; 

fl.l len = 0; 

return(fcntl(fd, F SETLK, &f1)); 


图 14-9 在 文件 整体 上 加 一 把 写 锁 
另 一 种 方法 是 用 write lock 函数 定义 lockfile 函数 。 
#define lockfile(fd) write_lock((fd), 0, SEEK_SET, 0) | 


5. 在 文件 尾 端 加 锁 

在 对 相对 于 文件 尾 端的 字 节 范 围 加 锁 或 解锁 时 需要 特别 小 心 。 大 多 数 实现 按照 1 whence 
的 SEEK CUR 或 SEEK END 值 ， 用 1 start 以 及 文件 当前 位 置 或 当前 长 度 得 到 绝对 文件 偏 移 
量 。 但 是 ， 常 常 需要 相对 于 文件 的 当前 长 度 指定 一 把 锁 ， 但 又 不 能 调用 Estat 来 得 到 当前 文件 
长 度 ， 因 为 我 们 在 该 文件 上 没有 锁 。( 在 fstat 和 锁 调 用 之 间 ， 可 能 会 有 另 一 个 进程 改变 该 文 
件 长 度 。) 

考虑 以 下 代码 序列 : 

writew_lock(fd, 0, SEEK_END, 0); 

write(fd, buf, 1); 


un_lock(fd, 0, SEEK END); 
write(fd, buf, 1); 


该 代码 序列 所 做 的 可 能 并 不 是 你 所 期 望 的 。 它 得 到 一 把 写 锁 ， 该 写 锁 从 当前 文件 尾 端 起 ， 包 括 以 
后 可 能 追加 写 到 该 文件 的 任何 数据 。 假定 , 该 文件 偏 移 量 处 于 文件 尾 端 时 , 执行 第 一 个 write, 
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这 个 操作 将 文件 延伸 了 1 个 字 节 ， 而 该 字 节 将 被 加 锁 。 跟 随 其 后 的 是 解锁 操作 ， 其 作用 是 对 以 
后 追加 写 到 文件 上 的 数据 不 再 加 锁 。 但 在 其 之 前 刚 追 加 写 的 一 个 字 节 则 保留 加 锁 状 态 。 当 执行 
第 二 个 写 时 ， 文 件 尾 端 又 延伸 了 1 个 字 节 ， 但 该 字 节 并 未 加 锁 。 由 此 代码 序列 造成 的 文件 锁 状 态 
如 图 14-10 所 示 。 

已 加 锁 





£3 : 追加 写 入 的 
第 一 个 write 之 后 的 文件 状态 第 一 个 字 节 











re 六 sams | amaan 
图 14-10 文件 区 域 锁 

当 对 文件 的 一 部 分 加 锁 时 ， 内 核 将 指定 的 偏 移 量变 换 成 绝对 文件 偏 移 量 。 另 外 ， 除 了 指定 一 个 
绝对 偏 移 量 (SEEK SET) 之 外 ，fcntl 还 允许 我 们 相对 于 文件 中 的 某 个 点 指定 该 偏 移 量 ， 这 个 点 
是 指 当 前 偏 移 量 (SEEK_CUR) 或 文件 尾 端 (SEEK_END)。 当 前 偏 移 量 和 文件 尾 端 可 能 会 不 断 变 化 ， 
而 这 种 变化 又 不 应 影响 现 有 锁 的 状态 ， 所 以 内 核 必 须 独 立 于 当前 文件 偏 移 量 或 文件 尾 端 而 记 住 锁 。 

如 果 想 解除 的 锁 中 包括 第 一 次 write 所 写 的 1 个 字 节 ， 那 么 应 指定 长 度 为 -1。 负 的 长 度 值 
表示 在 指定 偏 移 量 之 前 的 字 节 数 。 

6. 建议 性 锁 和 强制 性 锁 

考虑 数据 库 访 问 例 程 库 。 如 果 该 库 中 所 有 函数 都 以 一 致 的 方法 处 理 记录 锁 ， 则 称 使 用 这 些 函 
数 访问 数据 库 的 进程 集 为 合作 进程 (cooperating process)。 如 果 这 些 函 数 是 唯一 地 用 来 访问 数据 
库 的 函数 ， 那 么 它们 使 用 建议 性 锁 是 可 行 的 。 但 是 建议 性 锁 并 不 能 阻止 对 数据 库 文 件 有 写 权 限 的 
任何 其 他 进程 写 这 个 数据 库 文 件 。 不 使 用 数据 库 访问 例 程 库 协 同一 致 的 方法 来 访问 数据 库 的 进程 
是 非 合作 进程 。 

强制 性 锁 会 让 内 核 检查 每 一 个 open. read 和 write， 验 证 调用 进程 是 否 违 背 了 正在 访问 
的 文件 上 的 某 一 把 锁 。 强 制 性 锁 有 时 也 称 为 强迫 方式 锁 Cenforcement-mode locking). 


从 图 14-2 中 可 以 看 出 ，Linux 3.2.0 和 Solaris 10 提供 强制 性 记录 锁 ， 而 FreeBSD 8.0 和 Mac OS X 
10.6.8 则 不 提供 。 强 制 性 记录 锁 不 是 Single UNIX Specification 的 组 成 部 分 。 在 Linux 中 ， 如 果 用 户 
想 要 使 用 强制 性 锁 ， 则 需要 在 各 个 文件 系统 基础 上 用 mount 命令 的 -o mand 选项 来 打开 该 机 制 。 


对 一 个 特定 文件 打开 其 设置 组 ID 位 、 关 闭 其 组 执行 位 便 开 启 了 对 该 文件 的 强制 性 锁 机 制 ( 回 
忆 图 4-12)。 因 为 当 组 执行 位 关闭 时 ， 设 置 组 ID 位 不 再 有 意义 ， 所 以 SVR3 的 设计 者 借用 两 者 的 
这 种 组 合 来 指定 对 一 个 文件 的 锁 是 强制 性 的 而 非 建议 性 的 。 

如 果 一 个 进程 试图 读 (read) MS (write) 一 个 强制 性 锁 起 作用 的 文件 ， 而 欲 读 、 写 的 部 
分 又 由 其 他 进程 如 上 了 锁 ， 此 时 会 发 生 什 么 呢 ? 对 这 一 问题 的 回答 取决 于 3 方面 的 因素 : 操作 类 
型 (read 或 write)、 其 他 进程 持 有 的 锁 的 类 型 〈 读 锁 或 写 锁 ) 以 及 read 或 write 的 描述 符 
是 阻塞 还 是 非 阻塞 的 。 图 14-11 列 出 了 8 种 可 能 性 。 
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其 他 进程 在 该 区 域 上 阻塞 描述 符 非 阻塞 描述 符 
| | read | write | read | write | 





| — x9 — | 允许 阻塞 允许 EAGAIN 
写 锁 阻塞 阻塞 EAGAIN | EAGAIN 
图 14-11 强制 性 锁 对 其 他 进程 的 read 和 write 的 影响 
除了 图 14-11 中 的 read 和 write 函数 ， 另 一 个 进程 持 有 的 强制 性 锁 也 会 对 open 函数 产生 
影响 。 通 常 ， 即 使 正在 打开 的 文件 具有 强制 性 记录 锁 ， 该 open 也 会 成 功 。 随 后 的 read 或 write 
依从 于 图 14-11 中 所 示 的 规则 。 但 是 ， 如 果 欲 打开 的 文件 具有 强制 性 记录 锁 〈 读 锁 或 写 锁 )， 而 且 
open 调用 中 的 标志 指定 为 0_TRUNC BK O_CREAT, 则 不 论 是 否 指定 O_NONBLOCK, open 都 立即 
出 错 返 回 ，errno 设置 为 EAGAIN。 


只 有 Solaris 对 O CREAT 标志 处 理 为 出 错 。 当 打开 一 个 具 强 制 性 锁 的 文件 时 ，Linux 允许 指定 
O CREAT 标志 。 对 O_TRUNC 标志 产生 open 出 错 是 有 意义 的 ， 因 为 对 于 一 个 文件 来 讲 ， 若 另 一 
个 进程 持 有 它 的 读 锁 或 写 锁 ， 那 么 它 就 不 能 被 截 短 为 0。 但 是 对 0_CREAT 标志 在 返回 时 设置 出 错 
就 没什么 意义 了 ， 因 为 该 标志 表示 ， 只 有 在 该 文件 不 存在 时 才 创 建 ， 但 由 于 另 一 个 进程 持 有 该 文 
件 的 记录 锁 ， 所 以 该 文件 肯定 是 存在 的 。 


这 种 open 的 锁 冲 突 处 理 方式 可 能 会 导致 令 人 惊异 的 结果 。 在 开发 本 节 习 题 的 时 候 ， 我 们 曾 
编写 过 一 个 测试 程序 ， 它 打开 一 个 文件 〈 其 模式 指定 为 强制 性 锁 )， 对 该 文件 整体 设置 一 把 读 锁 ， 
然后 休眠 一 段 时 间 。( 回 忆 图 14-11， 读 锁 应 当 阻止 其 他 进程 写 该 文件 。) 在 这 段 休眠 时 间 内 ， 用 
某 些 典型 的 UNIX 系统 程序 和 操作 符 对 该 文件 进行 处 理 ， 发 现下 列 情 况 。 

。 可 用 ed 编辑 器 对 该 文件 进行 编辑 操作 ,而 且 编 辑 结果 可 以 写 回 磁盘 ! 强制 性 记录 锁 根 本 

不 起 作用 。 用 某 些 UNIX 系统 版 本 提供 的 系统 调用 跟踪 特性 ， 对 ed 操作 进行 跟踪 分 析 发 
Rh, ea 将 新 内 容 写 到 一 个 临时 文件 中 ， 然 后 删除 原文 件 ， 最 后 将 临时 文件 名 改 为 原文 件 
名 。 强 制 性 锁 机 制 对 unlink 函数 没有 影响 ， 于 是 这 一 切 就 发 生 了 。 


Æ FreeBSD 8.0 4e Solaris 10 中 ， 用 truss(1) 命 令 可 以 得 到 一 个 进程 的 系统 调用 跟踪 信 
息 。Linux 32.0 出 于 相同 的 目的 提供 了 strace(1) 命 令 。Mac OS X 10.6.8 提供 了 dtruss(1m) 
命令 来 追踪 系统 调用 ， 但 该 命令 的 使 用 需要 超级 用 户 的 权限 。 


。 不 能 用 vi 编辑 器 编辑 该 文件 。vi 可 以 读 该 文件 的 内 容 ， 但 是 如 果 试图 将 新 的 数据 写 到 
该 文件 中 ， 就 会 出 错 返回 〈ERAGRAIN)。 如 果 试 图 将 新 数据 追加 写 到 该 文件 中 ， 则 write 
阻塞 。vi 的 这 种 行为 与 我 们 所 希望 的 一 样 。 

e 使 用 Korn shell 的 > 和 >> 操 作 符 重 写 或 媚 加 写 该 文件 ， 会 产生 出 误 信 息 “cannot create”. 

e 在 Bourne shell 下 使 用 > 操作 符 也 会 出 错 ， 但 是 使 用 >> 操 作 符 时 只 阻塞 ， 在 解除 强制 性 锁 后 会 
继续 进行 处 理 。( 这 两 种 shell 在 执行 追加 写 操作 时 之 所 以 会 产生 的 差异 ， 是 因为 Kom shell 以 
O CREAT fil O_APPEND 标志 打开 文件 ， 而 上 面 已 提 及 指定 O_CREAT 会 产生 出 错 返回 。 但 是 ， 
Bourne shell 在 该 文件 已 存在 时 并 不 指定 O_CREAT, ATLL open 成 功 , 而 下 一 个 write 则 阻塞 。) 

产生 的 结果 随 所 用 操作 系统 版 本 的 不 同 而 不 同 。 从 这 样 一 个 习题 中 可 见 ， 在 使 用 强制 性 锁 时 

还 需 有 所 警惕 。 从 ed 实例 可 以 看 到 ， 强 制 性 锁 是 可 以 设法 避 开 的 。 
一 个 恶意 用 户 可 以 使 用 强制 性 记录 锁 ， 对 大 家 都 可 读 的 文件 加 一 把 读 锁 ， 这 样 就 能 阻止 任何 
人 写 该 文件 (当然 ， 该 文件 应 当 是 强制 性 锁 机 制 起 作用 的 ， 这 可 能 要 求 该 用 户 能 够 更 改 该 文件 的 
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权限 位 )。 考 虑 一 个 数据 库 文件 ， 它 是 大 家 都 可 读 的 ， 并 且 是 强制 性 锁 机 制 起 作用 的 。 如 果 一 个 
恶意 用 户 要 对 整个 这 个 文件 持 有 一 把 读 锁 ， 其 他 进程 就 不 能 再 写 该 文件 。 


whl 
图 14-12 中 的 程序 可 以 用 于 确定 一 个 系统 是 否 支持 强制 性 锁 机 制 。 


#include "apue.h" 
#include <errno.h> 
#include <fcntl.h> 
#include <sys/wait.h> 


int 
main(int argc, char *argv[]) 


{ 


int fd; 
pid_t pid; 
char buf [5]; 
struct stat statbuf; 


if (argc != 2) { 
fprintf(stderr, "usage: $s filename\n", argv[0]); 
exit(1); 


if ((fd = open(argv[1], O RDWR | O CREAT | O TRUNC, FILE MODE)) < O0) 
err sys("open error"); 

if (write(fd, "abcdef", 6) !- 6) 
err sys("write error"); 


/* turn on set-group-ID and turn off group-execute */ 

if (fstat(fd, &statbuf) < 0) 
err sys("fstat error"); 

if (fchmod(fd, (statbuf.st mode & -S IXGRP) | S ISGID) « 0) 
err sys("fchmod error"); 


TELL WAIT () ; 


if ((pid = fork()) < 0) { 
err_sys("fork error"); 
} else if (pid > 0) { /* parent */ 
/* write lock entire file */ 
if (write_lock(fd, 0, SEEK_SET, 0) < 0) 
err_sys("write_lock error"); 


TELL CHILD (pid); 
if (waitpid(pid, NULL, 0) < 0) 
err sys("waitpid error"); 
} else { /* child */ 
WAIT PARENT(); /* wait for parent to set lock */ 


set fl(fd, O NONBLOCK) ; 


/* first let's see what error we get if region is locked */ 
if (read lock(fd, 0, SEEK SET, 0) !- -1)/* no wait */ 


+ 
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err_sys("child: read_lock succeeded") ; 
printf ("read lock of already-locked region returns %d\n", 
errno); 


/* now try to read the mandatory locked file */ 
if (lseek(fd, 0, SEEK SET) -- -1) 
err sys("lseek error"); 
if (read(fd, buf, 2) < 0) 
err ret("read failed (mandatory locking works)"); 
else 
printf("read OK (no mandatory locking), buf = %2.2s\n", 
buf); 
} 
exit(0); 


图 14-12 ”确定 是 否 支 持 强制 性 锁 

此 程序 首先 创建 一 个 文件 ， 并 使 强制 性 锁 机 制 对 其 起 作用 。 然 后 程序 分 出 一 个 父 进程 和 一 个 
子 进 程 。 父 进程 对 整个 文件 设置 一 把 写 锁 ， 子 进程 则 先 将 该 文件 的 描述 符 设 置 为 非 阻塞 的 ， 然 后 
企图 对 该 文件 设置 一 把 读 锁 ， 我 们 期 望 这 会 出 错 返 回 ， 并 希望 看 到 系统 返回 是 EACCES 或 
EAGAIN。 接 着 ， 子 进程 将 文件 读 、 写 位 置 调整 到 文件 起 点 ， 并 试图 读 (read) 该 文件 。 如 果 系 
统 提 供 强 制 性 锁 机 制 ， 则 read 应 返回 EACCES 或 EAGAIN (因为 该 描述 符 是 非 阻塞 的 )， 否 则 
read 返回 所 读 的 数据 。 在 Solaris 10 上 运行 此 程序 〈 该 系统 支持 强制 性 锁 机 制 )， 得 到 ， 

$ ./a.out temp.lock 


read lock of already-locked region returns 11 
read failed (mandatory locking works): Resource temporarily unavailable 


查看 系统 头 文件 或 intro(2) 手 册页 ， 可 以 看 到 errno fü 11 对 应 于 EAGAIN。 若 在 FreeBSD 8.0 
运行 此 程序 ， 则 得 到 : 
$ ./a.out temp.lock 


read lock of already locked region returns 35 
read OK (no mandatory locking), buf - ab 


HH, errno 值 35 对 应 于 EAGAIN。 该 系统 不 支持 强制 性 锁 。 a 
s XH 


让 我 们 回 到 本 节 的 第 一 个 问题 : 当 两 个 人 同时 编辑 同一 个 文件 时 将 会 怎样 呢 ? 一 般 的 UNIX 
系统 文本 编辑 器 并 不 使 用 记录 锁 ， 所 以 对 此 问题 的 回答 仍然 是 : 该 文件 的 最 后 结果 取决 于 写 该 文 
件 的 最 后 一 个 进程 。 

某 些 版 本 的 vi 编辑 器 使 用 建议 性 记录 锁 。 即 使 我 们 使 用 这 种 版 本 的 vi 编辑 器 ， 它 仍然 不 能 
阻止 其 他 用 户 使 用 另 一 个 没有 使 用 建议 性 记录 锁 的 编辑 器 。 

若 系统 提供 强制 性 记录 锁 ， 那 么 我 们 可 以 修改 自己 常用 的 编辑 器 来 使 用 它 〈 如 果 我 们 有 该 编 
辑 器 的 源 代码 )。 如 果 没 有 该 编辑 器 的 源 代码 ， 那 么 可 以 试 一 试 下 述 方 法 。 编 写 一 个 vi 的 前 端 程 
序 。 该 程序 立即 调用 fork， 然 后 父 进程 上 只 等 待 子 进程 完成 。 子 进程 打开 在 命令 行 中 指定 的 文件 ， 
使 强制 性 锁 起 作用 ， 对 整个 文件 设置 一 把 写 锁 ， 然 后 执行 vi。 在 vi 运行 时 ， 该 文件 是 加 了 写 锁 
的 ， 所 以 其 他 用 户 不 能 修改 它 。 当 vi 结束 时 ， 父 进程 从 wait 返回 ， 自 编 的 前 端 程序 结束 。 

虽然 可 以 编写 这 种 类 型 的 小 型 前 端 程序 ， 但 它 却 不 起 作用 。 问 题 出 在 大 多 数 编辑 器 读 它 们 的 
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输入 文件 ， 然 后 关闭 它 。 只 要 引用 被 编辑 文件 的 描述 符 关 闭 了 ， 那 么 加 在 该 文件 上 的 锁 就 被 释放 
了 。 这 意味 着 ， 在 编辑 器 读 了 该 文件 的 内 容 后 ， 随 即 关闭 了 该 文件 ， 那 么 锁 也 就 不 存在 了 。 这 个 


前 端 程序 中 没有 任何 方法 可 以 阻止 这 一 点 。 a 
在 第 20 章 中 ， 我 们 将 使 用 数据 库 函数 库 中 的 记录 锁 来 提供 多 个 进程 的 并 发 访问 。 我 们 还 将 
提供 一 些 时 间 测 量 ， 以 观察 记录 锁 对 进程 的 影响 。 [499| 


14.4 1/0 多 路 转 接 


从 一 个 描述 符 读 ， 然 后 又 写 到 另 一 个 描述 符 时 ， 可 以 在 下 列 形式 的 循环 中 使 用 阻塞 LO: 


while ((n=read(STDIN_FILENO, buf, BUFSIZ)) > 0) 
if (write (STDOUT_FILENO, buf, n) != n) 
err_sys ("write error"); 


这 种 形式 的 阻塞 IO 到 处 可 见 。 但 是 如 果 必 须 从 两 个 描述 符 读 ， 又 将 如 何 呢 ? 在 这 种 情况 下 ， 
我 们 不 能 在 任 一 个 描述 符 上 进行 阻塞 读 (read)， 否 则 可 能 会 因为 被 阻塞 在 一 个 描述 符 的 读 操作 
上 而 导致 另 一 个 描述 符 即使 有 数据 也 无 法 处 理 。 所 以 为 了 处 理 这 种 情况 需要 另 一 种 不 同 的 技术 。 

让 我 们 观察 telnet(1) 命 令 的 结构 。 该 程序 从 终端 (标准 输入 ) 读 ， 将 所 得 数据 写 到 网 络 连 
Be b. 同时 从 网 络 连接 读 , 将 所 得 数据 写 到 终端 上 (标准 输出 )。 在 网 络 连 接 的 男 一 端 ，telnetd 
守护 进程 读 用 户 键入 的 命令 ， 并 将 所 读 到 的 送 给 shell， 这 如 同 用 户 登 录 到 远程 机 器 上 一 样 。 
telnetd 守护 进程 将 执行 用 户 键入 命令 而 产生 的 输出 通过 telnet 命令 送 回 给 用 户 ， 并 显示 在 
用 户 终端 上 。 图 14-13 显示 了 这 种 工作 情景 。 


终端 上 telnet telnetd 
14-13. telnet 程序 概观 
telnet 进程 有 两 个 输入 ， 两 个 输出 。 我 们 不 能 对 两 个 输入 中 的 任 一 个 使 用 阻塞 read, 
为 我 们 不 知道 到 底 哪 一 个 输入 会 得 到 数据 。 
处 理 这 种 特殊 问题 的 一 种 方法 是 , 将 一 个 进程 变 成 两 个 进程 (用 fork), 每 个 进程 处 理 一 条 数据 
通路 。 图 14-14 中 显示 了 这 种 安排 。(System V 的 uucp 通信 和 包 提 供 了 cu() 命 令 ， 其 结构 与 此 相似 。) 


telnet 命令 
( 父 进程 ) 

We 
的 用 户 守护 进程 
se telnet 命令 PE dd 
( 子 进程 ) 











图 14-14 ”使 用 两 个 进程 实现 telnet 程序 


如 果 使 用 两 个 进程 ， 则 可 使 每 个 进程 都 执行 阻塞 read。 但 是 这 也 产生 了 问题 : 操作 什么 时 候 终 
iE? 如 果子 进程 接收 到 文件 结束 符 (telneta 守护 进程 使 网 络 连接 断 开 )， 那 么 该 子 进程 终止 ， 然 后 
父 进程 接收 到 SIGCHLD 信号 。 但 是 ， 如 果 父 进程 终止 〈 用 户 在 终端 上 键入 了 文件 结束 符 )， 那 么 父 
进程 应 通知 子 进程 停止 。 为 此 可 以 使 用 一 个 信号 〈 如 SIGUSR1)， 但 这 使 程序 变 得 更 加 复杂 。 

我 们 可 以 不 使 用 两 个 进程 ， 而 是 用 一 个 进程 中 的 两 个 线程 。 虽 然 这 避免 了 终止 的 复杂 性 ， 但 
却 要 求 处 理 两 个 线程 之 间 的 同步 ， 在 复杂 性 方面 这 可 能 会 得 不 偿 失 。 
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另 一 个 方法 是 仍旧 使 用 一 个 进程 执行 该 程序 ， 但 使 用 非 阻 塞 UO 读 取 数据 。 其 基本 思想 是 : 
将 两 个 输入 描述 符 都 设置 为 非 阻塞 的 ， 对 第 一 个 描述 符 发 一 个 read。 如 果 该 输入 上 有 数据 ， 则 
读数 据 并 处 理 它 。 如 果 无 数据 可 读 ， 则 该 调用 立即 返回 。 然 后 对 第 二 个 描述 符 作 同样 的 处 理 。 在 
此 之 后 ， 等 待 一 定 的 时 间 〈 可 能 是 若干 秒 )， 然 后 再 尝试 从 第 一 个 描述 符 读 。 这 种 形式 的 循环 称 
为 轮 询 。 这 种 方法 的 不 足 之 处 是 浪费 CPU 时 间 。 大 多 数 时 间 实 际 上 是 无 数据 可 读 , 因此 执行 read 
系统 调用 浪费 了 时 间 。 在 每 次 循环 后 要 等 多 长 时 间 再 执行 下 一 轮 循环 也 很 难 确定 。 虽 然 轮 询 技术 
在 支持 非 阻 塞 VO 的 所 有 系统 上 都 可 使 用 ， 但 是 在 多 任务 系统 中 应 当 避 免 使 用 这 种 方法 。 

还 有 一 种 技术 称 为 异步 VO (asynchronous IO )。 利 用 这 种 技术 ， 进 程 告 诉 内 核 : 当 描 述 符 准 
备 好 可 以 进行 VO 时 ， 用 一 个 信号 通知 它 。 这 种 技术 有 两 个 问题 。 首 先 ， 尽 管 一 些 系统 提供 了 各 
自 的 受 限 形式 的 异步 IO, 但 POSIX 采纳 了 另外 一 套 标 准 化 接口 , 所 以 可 移植 性 成 为 一 个 问题 (以 
前 ，POSIX 异步 IO 是 Single UNIX Specification 中 是 可 选 设施 ， 但 现在 ， 这 些 接口 在 SUSv4 中 
是 必需 的 )。System V 提供 了 SIGPOLL 信号 来 支持 受 限 形式 的 异步 UO， 但 是 仅 当 描述 符 引 用 
STREAMS 设备 时 ， 此 信和 号 才 起 作用 。BSD 有 一 个 类 似 的 信号 SIGIO， 但 也 有 类 似 的 限制 : 仅 当 
描述 符 引 用 终端 设备 或 网 络 时 它 才能 起 作用 。 

这 种 技术 的 第 二 个 问题 是 ， 这 种 信号 对 每 个 进程 而 言 只 有 1 个 (SIGPOLL 或 SIGIO)。 如 果 
使 该 信号 对 两 个 描述 符 都 起 作用 在 我 们 正在 讨论 的 实例 中 ， 从 两 个 描述 符 读 )， 那 么 进程 在 接 到 
此 信号 时 将 无 法 判别 是 哪 一 个 描述 符 准备 好 了 。 尽 管 POSIX.1 异步 IO 接口 允许 选择 哪个 信号 作为 
通知 ， 但 能 用 的 信号 数量 仍 远 小 于 潜在 的 打开 文件 描述 符 的 数量 。 为 了 确定 是 哪 一 个 描述 符 准备 好 
了 ， 仍 需 将 这 两 个 描述 符 都 设置 为 非 阻塞 的 ， 并 顺序 尝试 执行 /JO。 我 们 将 在 14.5 节 讨 论 异 步 VO. 

一 种 比较 好 的 技术 是 使 用 IO 多 路 转 接 (IO mnultiplexing)。 为 了 使 用 这 种 技术 ， 先 构造 一 张 
我 们 感 兴 趣 的 描述 符 〈 通 常 都 不 止 一 个 ) 的 列表 ， 然 后 调用 一 个 函数 ， 直 到 这 些 描述 符 中 的 一 个 
已 准备 好 进行 /O 时 ， 该 函数 才 返 回 。poll、pselect 和 select XX 3 个 函数 使 我 们 能 够 执行 
VO 多 路 转 接 。 在 从 这 些 函 数 返回 时 ， 进 程 会 被 告知 哪些 描述 符 已 准备 好 可 以 进行 IO。 

POSIX 指定 ,为 了 在 程序 中 使 用 select， 必须 包括 <sys/select.h>。 但 较 老 的 系统 还 要 
求 包括 <sys/types.h>、<sys/time.h> 和 <unistd.h>。 查 看 select 手册 页 可 以 弄 清 楚 你 
的 系统 都 支持 什么 。 

VO 多 路 转 接 在 4.2BSD 中 是 用 select 函数 提供 的 。 虽 然 该 函数 主要 用 于 终端 VO 和 网 络 VO, 
但 它 对 其 他 描述 符 同样 是 起 作用 的 。SVR3 在 增加 STREAMS 机 制 时 增加 了 poll 函数 。 但 在 SVR4 
之 前 ，poll 只 对 STREAMS 设备 起 作用 。SVR4 支持 对 任意 描述 符 起 作用 的 poll. 


14.4.1 Hj select 和 pselect 


在 所 有 POSIX 兼容 的 平台 上 ，select 函数 使 我 们 可 以 执行 VO 多 路 转 接 。 传 给 select 的 
参数 告诉 内 核 : 

。 我 们 所 关心 的 描述 符 ; 

。 对 于 每 个 描述 符 我 们 所 关心 的 条 件 〈 是 否 想 从 一 个 给 定 的 描述 符 读 ， 是 否 想 写 一 个 给 定 

的 描述 符 ， 是 否 关心 一 个 给 定 描述 符 的 异常 条 件 ); 

。 愿意 等 待 多 长 时 间 (可 以 永远 等 待 、 等 待 一 个 固定 的 时 间或 者 根本 不 等 待 )。 

从 select 返回 时 ， 内 核 告诉 我 们 : 

。 已 准备 好 的 描述 符 的 总 数量 ; 
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e 对 于 读 、 写 或 异常 这 3 个 条 件 中 的 每 一 个 ， 哪 些 描 述 符 已 准备 好 。 
使 用 这 种 返回 信息 ， 就 可 调用 相应 的 IO 函数 〈 一 般 是 read 或 write)， 并 且 确 知 该 函数 
不 会 阻塞 。 


#include <sys/select.h> 





int select (int maxfdpl, fd set *restrict readfds, 
fd_set *restrict writefds, fd_set *restrict exceptfds, 
struct timeval *restrict tvptr); 


返回 值 : 准备 就 绪 的 描述 符 数目 ;， 若 超时 ， 返 回 0， 若 出 错 ， 返 回 -1 


先 来 说 明 最 后 一 个 参数 ， 它 指定 愿意 等 待 的 时 间 长 度 ， 单 位 为 秒 和 微 秒 〈 回 忆 420 节 )。 有 
以 下 3 种 情况 。 

tvptr == NULL 
永远 等 待 。 如 果 捕 捉 到 一 个 信号 则 中 断 此 无 限期 等 待 。 当 所 指定 的 描述 符 中 的 一 个 已 准备 好 或 
捕捉 到 一 个 信号 则 返回 。 如 果 捕 捉 到 一 个 信号 ， 则 select 返回 -1，errno REN EINTR. 

tvptr->tv_sec == 0 && tvptr->ty_usec == 
根本 不 等 待 。 测 试 所 有 指定 的 描述 符 并 立即 返回 。 这 是 轮 询 系统 找到 多 个 描述 符 状 态 而 
不 阻塞 select 函数 的 方法 。 

fyptr-»tv sec != 0 || typtr->tv usec != 0 
等 待 指定 的 秒 数 和 微 秒 数 。 当 指定 的 描述 符 之 一 已 准备 好 ， 或 当 指定 的 时 间 值 已 经 超过 
时 立即 返回 。 如 果 在 超时 到 期 时 还 没有 一 个 描述 符 准 备 好 ， 则 返回 值 是 0。( 如 果 系 统 不 
提供 微 秒 级 的 精度 ， 则 tvptr->tv_usec 值 取 整 到 最 近 的 支持 值 。) 与 第 一 种 情况 一 样 ， 这 
种 等 待 可 被 捕捉 到 的 信号 中 断 。 

POSIX.1 允许 实现 修改 timeval 结构 中 的 值 ， 所 以 在 select 返回 后 ， 你 不 能 指望 该 结构 仍旧 保 

持 调用 select 之 前 它 所 包含 的 值 。FreeBSD 8.0、Mac OS X 10.6.8 和 Solaris 10 都 保持 该 结构 中 的 值 不 
变 。 但 是 ， 若 在 超时 时 间 尚 未 到 期 时 ，select HAW, ABA Linux 3.2.0 将 用 剩余 时 间 值 更 新 该 结构 。 


中 间 3 个 参数 readfds, writefds 和 exceptfds 是 指向 描述 符 集 的 指针 。 这 3 个 描述 符 集 说 明了 
我 们 关心 的 可 读 、 可 写 或 处 于 异常 条 件 的 描述 符 集合 。 每 个 描述 符 集 存储 在 一 个 fd set 数据 类 
型 中 。 这 个 数据 类 型 是 由 实现 选择 的 ， 它 可 以 为 每 一 个 可 能 的 描述 符 保持 一 位 。 我 们 可 以 认为 它 
只 是 一 个 很 大 的 字 节 数组 ， 如 图 14-15 所 示 。 
fdo fd? fd2 








readfds ”一 一 一 0 0 0 





| 每 个 可 能 的 描述 符 一 个 位 — 





writefds ——»> 0 0 0 





上 一 一 一 一 fd set 数据 类 型 —— — — 





exceptfds — s» 0 0 0 




















图 14-15 对 select 指定 读 、 写 和 异常 条 件 描述 符 
对 于 fd set 数据 类 型 ， 唯 一 可 以 进行 的 处 理 是 : 分 配 一 个 这 种 类 型 的 变量 ， 将 这 种 类 型 的 
一 个 变量 值 赋 给 同类 型 的 另 一 个 变量 ， 或 对 这 种 类 型 的 变量 使 用 下 列 4 个 函数 中 的 一 个 。 
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#include <sys/select.h> 


int FD ISSET(int fd, fd set *fdset) ; 


返回 值 : 若 应 在 描述 符 集中 ， 返 回 非 O 值 ， 否 则 ， 返 回 0 


void FD CLR(int fd, fd set *fdset); 


void FD SET(int fd, fd set *fdset); 





void FD ZERO(fd set *fdset) ; 


这 些 接口 可 实现 为 宏 或 函数 。 调用 FD ZERO 将 一 个 fà set 变量 的 所 有 位 设置 为 0。 要 开启 
描述 符 集 中 的 一 位 , 可 以 调用 FD sET. 调用 FD_CLR 可 以 清除 一 位 。 最 后 ,可 以 调用 FD_ISSET 
测试 描述 符 集中 的 一 个 指定 位 是 否 已 打开 。 

在 声明 了 一 个 描述 符 集 之 后 ,必须 用 FD_zERO 将 这 个 描述 符 集 置 为 0, 然后 在 其 中 设置 我 们 
关心 的 各 个 描述 符 的 位 。 具 体操 作 如 下 所 示 : 

fd set rset; 

int fd; 

FD ZERO(&rset); 


FD SET(fd, &rset); 
FD SET(STDIN FILENO, &rset); 


从 select 返回 时 ， 可 以 用 FD_ISSET 测试 该 集中 的 一 个 给 定位 是 否 仍 处 于 打开 状态 : 


if (FD ISSET(fd, &rset)) { 


} 


select 的 中 间 3 个 参数 (指向 描述 符 集 的 指针 ) 中 的 任意 一 个 (或 全 部 ) 可 以 是 空 指 针 ， 
这 表示 对 相应 条 件 并 不 关心 。 如 果 所 有 3 个 指针 都 是 NULL， 则 select 提供 了 比 sleep 更 精确 
的 定时 器 。( 回 忆 10.19 节 ，sleep 等 待 整数 秒 ， 而 select 的 等 待 时 间 则 可 以 小 于 1 秒 ， 其 实 
际 精度 取决 于 系统 时 钟 ,6) 习题 14.5 给 出 了 这 样 一 个 函数 。 

select 第 一 个 参数 maxfdp1 的 意思 是 “最 大 文件 描述 符 编号 值 加 1”。 考 虑 所 有 3 个 描述 符 
集 ， 在 3 个 描述 符 集中 找 出 最 大 描述 符 编 号 值 ， 然 后 加 1， 这 就 是 第 一 个 参数 值 。 也 可 将 第 一 个 参数 
设置 为 FED_SETSIZE， 这 是 <svs/select.h> 中 的 一 个 常量 ， 它 指定 最 大 描述 符 数 〈 经 常 是 1024)， 
但 是 对 大 多 数 应 用 程序 而 言 ， 此 值 太 大 了 。 确实 ， 大 多 数 应 用 程序 只 使 用 3 一 10 个 描述 符 〈 某 些 应 用 
程序 需要 更 多 的 描述 符 ， 但 这 种 UNIX 程序 并 不 典型 )。 通 过 指定 我 们 所 关注 的 最 大 描述 符 ， 内 核 就 
只 需 在 此 范围 内 寻找 打开 的 位 ， 而 不 必 在 3 个 描述 符 集中 的 数 百 个 没有 使 用 的 位 内 搜索 。 

例如 ， 图 14-16 所 示 的 两 个 描述 符 集 的 情况 就 好 像 是 执行 了 下 述 操 作 : 

fd set readset, writeset; 

FD ZERO(&readset); 

FD ZERO(&writeset); 

FD SET(0, &readset); 

FD SET(3, &readset); 

FD SET(1, &writeset); 


FD SET(2, &writeset); 
select(4, &readset, &writeset, NULL, NULL); 


因为 描述 符 编 号 从 0 开始 ， 所 以 要 在 最 大 描述 符 编号 值 上 加 1。 第 一 个 参数 实际 上 是 要 检查 
的 描述 符 数 〈 从 描述 符 0 开始 )。 
select 有 3 个 可 能 的 返回 值 。 


14.4 VO 多 路 转 接 407 


fd0 fdl fd2 fd3 




















readset: | 1 | 0 | 0 | 1 
一 一 > 这 以 后 的 位 都 没有 检查 
writeset: | 0 | 1 | l | 0 
maxfdp1 = 4 


图 14-16 select 的 样本 描述 符 集 

C1) 返回 值 -1 表示 出 错 。 这 是 可 能 发 生 的 ， 例 如 ， 在 所 指定 的 描述 符 一 个 都 没准 备 好 时 捕捉 
到 一 个 信号 。 在 此 种 情况 下 ， 一 个 描述 符 集 都 不 修改 。 

(2) 返回 值 0 表示 没有 描述 符 准 备 好 。 者 指定 的 描述 符 一 个 都 没准 备 好 ， 指 定 的 时 间 就 过 了 ， 
那么 就 会 发 生 这 种 情况 。 此 时 ， 所 有 描述 符 集 都 会 置 0。 

(3) 一 个 正 返 回 值 说 明了 已 经 准备 好 的 描述 符 数 。 该 值 是 3 个 描述 符 集中 已 准备 好 的 描述 符 
数 之 和 ， 所 以 如 果 同 一 描述 符 已 准备 好 读 和 写 , 那么 在 返回 值 中 会 对 其 计 两 次 数 。 在 这 种 情况 下 ， 
3 个 描述 符 集中 仍旧 打开 的 位 对 应 于 已 准备 好 的 描述 符 。 

对 于 “准备 好 ”的 含义 要 作 一 些 更 具体 的 说 明 。 

。 若 对 读 集 Creadfds) 中 的 一 个 描述 符 进行 的 read 操作 不 会 阻塞 , 则 认为 此 描述 符 是 准备 好 的 。 

o 若 对 写 集 (writefds) 中 的 一 个 描述 符 进行 的 write 操作 不 会 阻塞 ， 则 认为 此 描述 符 是 准备 好 的 。 

。 若 对 异常 条 件 集 Cexceptfds) 中 的 一 个 描述 符 有 一 个 未 决 异常 条 件 ， 则 认为 此 描述 符 是 准 

备 好 的 。 现 在 ， 异 常 条 件 包括 : 在 网 络 连接 上 到 达 带 外 的 数据 ， 或 者 在 处 于 数据 包 模 式 
的 伪 终 端 上 发 生 了 某 些 条 件 。(Stevens[1990] 的 15.10 节 中 描述 了 后 一 种 条 件 。) 

。 对 于 读 、 写 和 异常 条 件 ， 普 通 文 件 的 文件 描述 符 总 是 返回 准备 好 。 

一 个 描述 符 阻塞 与 否 并 不 影响 select 是 和 否 阻塞 ， 理 解 这 一 点 很 重要 。 也 就 是 说 ， 如 果 希 望 读 
一 个 非 阻 塞 描述 符 ， 并 且 以 超时 值 为 $ 秒 调 用 select， 则 select 最 多 阻塞 5s。 相 类 似 ， 如 果 指 
定 一 个 无 限 的 超时 值 ， 则 在 该 描述 符 数据 准备 好 ， 或 捕捉 到 一 个 信号 之 前 ，select 会 一 直 阻 塞 。 

如 果 在 一 个 描述 符 上 碰 到 了 文件 尾 端 , 则 select 会 认为 该 描述 符 是 可 读 的 。 然后 调用 read, 
它 返 回 0， 这 是 UNIX 系统 指示 到 达 文 件 尾 端 的 方法 。( 很 多 人 错误 地 认为 ， 当 到 达 文 件 尾 端 时 ， 
select 会 指示 一 个 异常 条 件 。) 

POSIX.1 也 定义 了 一 个 select 的 变 体 ， 称 为 pselect。 


#include <sys/select.h> 





int pselect (int maxfdpl, £d set *restrict readfds, 
fd set *restrict writefds, fd set *restrict exceptfds, 
const struct timespec *restrict fsptr, 
const sigset t *restrict sigmask); 


返回 值 : 准备 就 绪 的 描述 符 数目 ， 若 超时 ， 返 回 0， 若 出 错 ， 返 回 -1 


除 下 列 几 点 外 ，pselect 4 select 相同 。 

e select 的 超时 值 用 timeval 结构 指定 ， 但 pselect 使 用 timespec it (ENZ 4.2 
节 中 timespec 结构 的 定义 )。timespec 结构 以 秒 和 纳 秒表 示 超 时 值 ， 而 非 秒 和 微 秒 。 
如 果 平 台 支 持 这 样 的 时 间 精 度 ， 那 么 timespec 就 能 提供 更 精准 的 超时 时 间 。 
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。 pselect 的 超时 值 被 声明 为 const， 这 保证 了 调用 pselect 不 会 改变 此 值 。 

e pselect 可 使 用 可 选 信号 屏蔽 字 。 若 sigmask 为 NULL， 那 么 在 与 信号 有 关 的 方面 ， 
pselect 的 运行 状况 和 select 相同 。 否 则 ，sigmask 指向 一 信号 屏蔽 字 ， 在 调用 
pselect 时 ,以 原子 操作 的 方式 安装 该 信号 屏蔽 字 。 在 返回 时 ， 恢 复 以 前 的 信号 屏蔽 字 。 


14.4.2 Hi poll 


poll 函数 类 似 于 select， 但 是 程序 员 接 口 有 所 不 同 。 虽 然 poll 函数 是 System V 引入 进 
来 支持 STREAMS 子 系统 的 ， 但 是 poll 函数 可 用 于 任何 类 型 的 文件 描述 符 。 


#include <poll.h> 


int poll(struct pollfd fdarray[], nfds_t nfds, int timeout) ; 
返回 值 : 准备 就 绪 的 描述 符 数目 ， 若 超时 ， 返 回 0， 若 出 错 ， 返 回 -1 
与 select Al], poll 不 是 为 每 个 条 件 ( 可 读 性 、 可 写 性 和 异常 条 件 ) 构造 一 个 描述 符 集 ， 
而 是 构造 一 个 pol1fd 结构 的 数组 ， 每 个 数组 元 素 指定 一 个 描述 符 编号 以 及 我 们 对 该 描述 符 感 兴 
BNA. 





struct pollfd { 
int fd; /* file descriptor to check, or < 0 to ignore */ 
short events; /* events of interest on fd */ 
short revents; /* events that occurred on fd */ 

i 


fdarray 数组 中 的 元 素数 由 nfds 指定 。 


由 于 历史 原因 ， 在 如 何 声明 nfds 参数 方面 有 几 种 不 同 的 方式 。SVR3 将 nfds 的 类 型 指定 为 
unsigned 1ong， 这 似乎 是 太 大 了 。 在 SVR4 手册 [AT&T 1990d] F, poll 原型 的 第 二 个 参数 的 
数据 类 型 为 size_t ( 见 图 2-21 中 的 基本 系统 数据 类 型 ), 但 在 <poll.h> 和 包含 的 实际 原型 中 ,第 
二 个 参数 的 数据 类 型 仍 指 定 为 unsigned long.Single UNIX Specification 定义 了 新 类 型 nfds t, 
该 类 型 允许 实现 选择 对 其 合适 的 类 型 并 且 隐 藏 了 应 用 细节 。 注 意 ， 因 为 返回 值 表示 数组 中 满足 事 
件 的 项 数 ， 所 以 这 种 类 型 必须 大 得 足以 保存 一 个 整数 。 

对 应 于 SVR4 的 SVID[AT&T 1989] 上 显示 ，poll 的 第 一 个 参数 是 struct pollfd 
fdarray(], 9» SVR4 手册 页 [AT&T 1990d] 上 则 显示 该 参数 为 struct pollfd *fdarray。 在 C 语 
言 中 ， 这 两 种 声明 是 等 价 的。 我 们 使 用 第 一 种 声明 是 为 了 重申 fdarray 指向 的 是 一 个 结构 数组 ， 
而 不 是 指向 单个 结构 的 指针 。 


应 将 每 个 数组 元 素 的 events 成 员 设 置 为 图 14-17 中 所 示 值 的 一 个 或 几 个 ， 通 过 这 些 值 告 诉 
内 核 我 们 关心 的 是 每 个 描述 符 的 哪些 事件 。 返 回 时 ，revents 成 员 由 内 核 设置 ， 用 于 说 明 每 个 描 
RERET. GER, poll 没有 更 改 events 成 员 。 这 与 select 不 同 ，select 修改 
其 参数 以 指示 哪 一 个 描述 符 已 准备 好 了 。) 

图 14-17 中 的 前 4 行 测试 的 是 可 读 性 ， 接 下 来 的 3 行 测试 的 是 可 写 性 ， 最 后 3 行 测 试 的 是 异 
常 条 件 。 最 后 3 行 是 由 内 核 在 返回 时 设置 的 。 即 使 在 events 字段 中 没有 指定 这 3 个 值 ， 如 果 相 
应 条 件 发 生 ， 在 revents 中 也 会 返回 它们 。 


有 些 poll 事件 的 名 字 中 包含 B4ND， 它 指 的 是 STREAMS 当中 的 优先 级 波段 。 想 要 了 解 关 
于 STREAMS 和 优先 级 波段 的 更 多 信息 ， 可 以 查看 Rago[1993]。 
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可 以 不 阻塞 地 读 高 优先 级 数据 以 外 的 数 
据 ( 等 效 于 POLLRDNORM | POLLRDBAND) 
POLLRDNORM 可 以 不 阻塞 地 读 普通 数据 
POLLRDBAND 可 以 不 阻塞 地 读 优 先 级 数据 
可 以 不 阻塞 地 读 高 优先 级 数据 


POLLOUT 可 以 不 阻塞 地 写 普通 数据 
POLLWRNORM 45 POLLOUT 相同 
POLLWRBAND 可 以 不 阻塞 地 写 优先 级 数据 
POLLERR 

POLLHUP 

POLLNVAL 描述 符 没 有 引用 一 个 打开 文件 





图 14-17 poll 的 events 和 revents 标志 
当 一 个 描述 符 被 挂 断 (POLLHUP) 后 ， 就 不 能 再 写 该 描述 符 ， 但 是 有 可 能 仍然 可 以 从 该 描述 
符 读 取 到 数据 。 
poll 的 最 后 一 个 参数 指定 的 是 我 们 愿意 等 竺 多 长 时 间 。 如 同 select 一 样 ， 有 3 种 不 同 的 情形 。 
timeout == -1 
永远 等 待 。( 某 些 系统 在 <stzropts .h> 中 定义 了 常量 INETIM， 其 值 通常 是 -1。) 当 所 指 
定 的 描述 符 中 的 一 个 已 准备 好 , 或 捕捉 到 一 个 信号 时 返回 。 如 果 捕 捉 到 一 个 信号 ， 则 poll 
返回 -1，errno 设置 为 EINTR。 
timeout == 0 
不 等 待 。 测 试 所 有 描述 符 并 立即 返回 。 这 是 一 种 轮 询 系统 的 方法 ， 可 以 找到 多 个 描述 符 
的 状态 而 不 阻塞 poll 函数 。 
timeout > 0 
等 待 timeout 毫秒 。 当 指定 的 描述 符 之 一 已 准备 好 ， 或 timeout 到 期 时 立即 返回 。 如 果 timeout 
到 期 时 还 没有 一 个 描述 符 准备 好 ， 则 返回 值 是 0。( 如 果 系 统 不 提供 毫秒 级 精度 ， 则 timeout 
值 取 整 到 最 近 的 支持 值 。) 
理解 文件 尾 端 与 挂 断 之 间 的 区 别 是 很 重要 的 。 如 果 我 们 正 从 终端 输入 数据 ， 并 键入 文件 
结束 符 ， 那 么 就 会 打开 POLLIN, 于 是 我 们 就 可 以 读 文件 结束 指示 (read 返回 0)。revents 
中 的 POLLHUP 没有 打开 。 如果 正 在 读 调制 解 调 器 , 并 且 电 话 线 已 挂 断 , 我 们 将 接 到 POLLHUP 


通知 。 
与 select 一 样 ， 一 个 描述 符 是 否 阻 塞 不 会 影响 poll 是 否 阻塞 。 
select l poll 的 可 中 断 性 


中 断 的 系统 调用 的 自动 重启 是 由 4.2BSD 引入 的 ( 见 10.5 节 )， 但 当时 select 函数 是 不 重 
启 的 。 这 种 特性 在 大 多 数 系统 中 一 直 延 续 了 下 来 ， 即 使 指定 了 SA RESTART 选项 也 是 如 此 。 但 是 ， 
在 SVR4 上 ， 如 果 指 定 了 SA RESTART, ABA select 和 poll 也 是 自动 重启 的 。 为 了 在 将 软件 
移植 到 SVR4 派生 的 系统 上 时 阻止 这 一 点 ， 如 果 信 号 有 可 能 会 中 断 select 或 po11， 就 要 使 用 
signal intr AMX (MLA 10-19). 

本 书 说 明 的 各 种 实现 在 接 到 一 信号 时 都 不 重启 动 poll 和 select， 即 便 使 用 了 SA RESTART 
标志 也 是 如 此 。 
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14.5 #2 1/0 


使 用 上 一 节 说 明 的 select Ml poll 可 以 实现 异步 形式 的 通知 。 关 于 描述 符 的 状态 ， 系 统 并 
不 主动 告诉 我 们 任何 信息 ， 我 们 需要 进行 查询 (调用 select 或 po11)。 如 在 第 10 章 中 所 述 ， 
信和 号 机 构 提 供 了 一 种 以 异步 形式 通知 某 种 事件 已 发 生 的 方法 。 由 BSD 和 System V 派生 的 所 有 系 
统 都 提供 了 某 种 形式 的 异步 VO, 使 用 一 个 信号 (在 System V 中 是 SIGPOLL, 在 BSD 中 是 SIGIO) 
通知 进程 ， 对 某 个 描述 符 所 关心 的 某 个 事件 已 经 发 生 。 我 们 在 前 面 的 章节 中 提 到 过 ， 这 些 形式 的 异 
4 vo 是 受 限制 的 ， 它们 并 不 能 用 在 所 有 的 文件 类 型 上 ， 而 且 只 能 使 用 一 个 信和 号。 如 果 要 对 一 个 以 
上 的 描述 符 进行 异步 /JO， 那 么 在 进程 接收 到 该 信号 时 并 不 知道 这 一 信号 对 应 于 哪 一 个 描述 符 。 

SUSv4 中 将 通用 的 异步 IO 机 制 从 实时 扩展 部 分 调整 到 基本 规范 部 分 。 这 种 机 制 解决 了 这 些 
陈旧 的 异步 VO 设施 存在 的 局 限 性 。 

在 我 们 了 解 使 用 异步 IO 的 不 同方 法 之 前 ， 需 要 先 讨论 一 下 成 本 。 在 用 异步 IO 的 时 候 ， 要 
通过 选择 来 灵活 处 理 多 个 并 发 操作 ， 这 会 使 应 用 程序 的 设计 复杂 化 。 更 简单 的 做 法 可 能 是 使 用 多 
线程 ， 使 用 同步 模型 来 编写 程序 ， 并 让 这 些 线程 以 异步 的 方式 运行 。 

使 用 POSIX 异步 VORA, BR FIRM. 

。 每 个 异步 操作 有 3 处 可 能 产生 错误 的 地 方 : 一 处 在 操作 提交 的 部 分 ， 一 处 在 操作 本 身 的 

结果 ， 还 有 一 处 在 用 于 决定 异步 操作 状态 的 函数 中 。 

e 与 POSIX 异步 IO 接口 的 传统 方法 相 比 ， 它 们 本 身 涉及 大 量 的 额外 设置 和 处 理 规则 。 

事实 上 , 并 不 能 把 非 异 步 IO 函数 称 作 “同步 ”的 ,因为 尽管 它们 相对 于 程序 流 来 说 是 同步 的 ， 
但 相对 于 VO 来 说 并 非 如 此 。 回 忆 第 3 章 中 关于 同步 写 的 讨论 。 当 从 write 函数 的 调用 返回 时 ， 
写 的 数据 是 持久 的 ， 我们 称 这 个 写 操 作为 “同步 ”的 。 也 不 能 依靠 把 传统 的 调用 归 类 为 “标准 ”的 
VO 调用 来 区 别传 统 的 VO 函数 和 异步 VO 函数 ， 因 为 这 样 会 使 它们 和 标准 VO 库 中 的 函数 调用 相 
混淆 。 为 了 避免 产生 这 种 混 消 ， 本 节 中 我 们 把 read 和 write 函数 归 类 为 “传统 ”的 VO DK, 


。 从 错误 中 恢复 可 能 会 比较 困难 。 举 例 来 说 ， 如 果 提 交 了 多 个 异步 写 操作 ， 其 中 一 个 失败 
了 ， 下 一 步 我 们 应 该 怎么 做 ? 如 果 这 些 写 操作 是 相关 的 ， 那 么 可 能 还 需要 撤销 所 有 成 功 
的 写 操作 。 


14.5.1 System V 异步 I/O 


在 System V 中 ,异步 VO 是 STREAMS 系统 的 一 部 分 , 它 只 对 STREAMS 设备 和 STREAMS 
管道 起 作用 。System V 的 异步 VO 信和 号 是 SIGPOLL. 

为 了 对 一 个 STREAMS 设备 启动 异步 HTO， 需 要 调用 ioct1， 将 它 的 第 二 个 参数 (request) 
设置 成 TI_SETSIG。 第 三 个 参数 是 由 图 14-18 中 的 一 个 或 多 个 常量 构成 的 整 型 值 。 这 些 常 量 是 在 
<stropts .h> 中 定义 的 。 

Ej STREAMS 机 制 相关 的 接口 在 SUSv4 中 已 被 标记 为 弃 用 ,所 以 这 里 不 讨论 它们 的 任何 细节 。 
关于 STREAMS 的 信息 详 见 Rago[1993]。 

除了 调用 ioctl 指定 产生 SIGPOLL 信和 号 的 条 件 以 外 ,还 应 为 该 信号 建立 信号 处 理 程序 。 回 
IZE 10-1, 对 于 SIGPOLL 的 默认 动作 是 终止 该 进程 ,所 以 应 当 在 调用 ioctl 之 前 建立 信号 处 理 
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S INPUT 可 以 不 阻塞 地 读 取 数 据 〈 非 高 优先 级 数据 ) 

S RDNORM 可 以 不 阻塞 地 读 取 普 通 数据 

S_RDBAND 可 以 不 阻塞 地 读 取 优 先 级 数据 

S_BANDURG 车 此 常量 和 S_RDBAND 一 起 指定 ， 当 我 们 可 以 不 阻塞 地 读 取 
优先 数据 时 ， 产 生 SIGURG 信号 而 非 SIGPOLL 


S_HIPRI 可 以 不 阻塞 地 读 取 高 优先 级 数据 

S OUTPUT 可 以 不 阻塞 地 写 普 通 数据 

S_WRNORM 与 S OUTPUT 相同 

S WRBAND 可 以 不 阻塞 地 写 优先 级 数据 

S_MSG 包含 SIGPOLL 信和 号 的 消息 已 经 到 达 流 头 部 
S_ERROR 流 有 错误 

S HANGUP 流 已 挂 起 





图 14-18 产生 SIGPOLL 信号 的 条 件 


14.5.2 BSD 546 I/O 


在 BSD 派生 的 系统 中 ， 异 步 VO 是 信号 SIGIO 和 SIGURG MAA. SIGIO 是 通用 异步 TO 
信号 ，SIGURG 则 只 用 来 通知 进程 网 络 连接 上 的 带 外 数据 已 经 到 达 。 

为 了 接收 SIGIO 信号 ， 需 执行 以 下 3 步 。 

CD 调用 signal 或 sigaction 为 SIGIO 信号 建立 信号 处 理 程序 。 

(2) Lit F SETOWN (H 3.14 节 ) 调用 fcnt1 来 设置 进程 ID 或 进程 组 ID， 用 于 接收 对 


于 该 描述 符 的 信号 。 510 
(3) 以 命令 F_SETFL 调用 fcnt1 设置 AsvNC 文件 状态 标志 ( 见 图 3-10), 使 在 该 描述 符 
上 可 以 进行 异步 VO. 


第 3 步 仅 能 对 指向 终端 或 网 络 的 描述 符 执行 ， 这 是 BSD 异步 VO 设施 的 一 个 基本 限制 。 
对 于 SIGURG 信号 ， 只 需 执 行 第 1 步 和 第 2 步 。 该 信号 仅 对 引用 支持 带 外 数据 的 网 络 连接 描 
述 符 而 产生 ， 如 TCP 连接 。 


14.5.3 POSIX 54 I/O 


POSIX 异步 VO 接口 为 对 不 同类 型 的 文件 进行 异步 VO 提供 了 一 套 一 致 的 方法 。 这 些 接口 来 
自 实 时 草案 标准 ， 该 标准 是 Single UNIX Specification 的 可 选项 。 在 SUSv4 中 ， 这 些 接口 被 移 到 
了 基本 部 分 中 ， 所 以 现在 所 有 的 平台 都 被 要 求 支持 这 些 接口 。 

这 些 异 步 VO 接口 使 用 AIO 控制 块 来 描述 IO 操作 。aiocb 结构 定义 了 AIO 控制 块 。 该 结 
构 至 少 包 括 下 面 这 些 字 段 〈 具 体 的 实现 可 能 还 包含 有 额外 的 字段 ): 


struct aiocb { 


int aio_fildes; /* file descriptor */ 

off t aio offset; /* file offset for I/O */ 
volatile void *aio buf; /* buffer for I/O */ 

size t aio nbytes; /* number of bytes to transfer */ 
int aio regprio; /* priority */ 

struct sigevent aio sigevent; /* signal information */ 


int aio lio opcode; /* operation for list I/O */ 
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aio fields 字段 表示 被 打开 用 来 读 或 写 的 文件 描述 符 。 读 或 写 操作 从 aio_offset 指定 
的 偏 移 量 开始 。 对 于 读 操作 ， 数 据 会 复制 到 缓冲 区 中 ， 该 缓冲 区 从 aio_buf 指定 的 地 址 开始 。 
对 于 写 操作 ， 数 据 会 从 这 个 缓冲 区 中 复制 出 来 。aio_nbytes 字段 包含 了 要 读 或 写 的 字 节 数 。 

注意 ， 异 步 VO 操作 必须 显 式 地 指定 偏 移 量 。 异 步 VO 接口 并 不 影响 由 操作 系统 维护 的 文件 
偏 移 量 。 只 要 不 在 同一 个 进程 里 把 异步 VO 函数 和 传统 VO 函数 混在 一 起 用 在 同一 个 文件 上 ， 就 不 
会 导致 什么 问题 。 同时 值得 注意 的 是 ， 如 果 使 用 异步 VO 接口 向 一 个 以 追加 模式 (使 用 0O_APPEND) 
打开 的 文件 中 写 入 数据 ，AIO 控制 块 中 的 aio_offset 字段 会 被 系统 忽略 。 

其 他 字段 和 传统 VO 函数 中 的 不 一 致 。 应 用 程序 使 用 aio_reqprio 字段 为 异步 IO 请 求 提示 
顺序 。 然 而 ， 系 统 对 于 该 顺序 只 有 有 限 的 控制 能 力 ， 因 此 不 一 定 能 遵循 该 提示 。aio_1lio_opcode 

字段 只 能 用 于 基于 列表 的 异步 LO， 我 们 在 稍 后 再 讨论 它 。aio_sigevent 字段 控制 ， 在 IO FF 

件 完成 后 ， 如 何 通 知 应 用 程序 。 这 个 字段 通过 sigevent 结构 来 描述 。 


struct sigevent { 


int sigev notify; /* notify type */ 

int sigev_signo; /* signal number */ 
union sigval sigev_value; /* notify argument */ 
void (*sigev_notify_function) (union sigval); /* notify function */ 
pthread_attr_t *sigev_notify_attributes; /* notify attrs */ 


E 
sigev notify 字段 控制 通知 的 类 型 。 取 值 可 能 是 以 下 3 个 中 的 一 个 。 
SIGEV_NONE 异步 VO 请 求 完 成 后 ， 不 通知 进程 。 
SIGEV SIGNAL ”异步 VO 请 求 完 成 后 ， 产 生 由 sigev_signo 字段 指定 的 信号 。 如 果 应 用 程 
序 已 选择 捕捉 信号 ， 且 在 建立 信号 处 理 程序 的 时 候 指定 了 SA SIGINFO bi 
志 ， 那 么 该 信号 将 被 入 队 《〈 如 果实 现 支 持 排队 信号)。 信 和 号 处 理 程序 会 传送 
给 一 个 siginfo 结构 ， 该 结构 的 si value 字段 被 设置 为 sigev_value 
(如 果 使 用 了 SA SIGINFO 标志 )。 
SIGEV THREAD “FH 1O 请 求 完成 时 ， 由 sigev_notify_function 字段 指定 的 函数 被 
调用 。sigev_value 字段 被 传 入 作为 它 的 唯一 参数 。 除 非 sigev_notify_ 
attributes 字段 被 设 定 为 pthread 属性 结构 的 地 址 ， 且 该 结构 指定 了 一 
个 另外 的 线程 属性 ， 否 则 该 函数 将 在 分 离 状 态 下 的 一 个 单独 的 线程 中 执行 。 
在 进行 异步 VO 之 前 需要 先 初始 化 AIO 控制 块 , 调用 aio read 函数 来 进行 异步 读 操作 , 或 
调用 aio write 函数 来 进行 异步 写 操作 。 
#include <aio.h> 


int aio read(struct aiocb *aiocb) ; 


int aio write(struct aiocb *aiocb); 





两 个 函数 的 返回 值 : 老成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 
当 这 些 函数 返回 成 功 时 ， 异 步 IO 请 求 便 已 经 被 操作 系统 放 入 等 竺 处理 的 队列 中 了 。 这 些 返 
回 值 与 实际 UO 操作 的 结果 没有 任何 关系 。LO 操作 在 等 待 时 ， 必 须 注意 确保 AIO 控制 块 和 数据 库 
缓冲 区 保持 稳定 ; 它们 下 面 对 应 的 内 存 必须 始终 是 合法 的 ， 除 非 IO 操作 完成 ， 否 则 不 能 被 复 用 。 
要 想 强制 所 有 等 待 中 的 异步 操作 不 等 待 而 写 入 持久 化 的 存储 中 ， 可 以 设立 一 个 AIO 控制 块 并 
调用 aio_fsync MA. 
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#include <aio.h> 


int aio fsync(int op, struct aiocb *aiocb); 





返回 值 ， 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 





AIO 控制 块 中 的 aio_fildes 字段 指定 了 其 异步 写 操作 被 同步 的 文件 。 如 果 op 参数 设 定 为 
0_DSYNC， 那 么 操作 执行 起 来 就 会 像 调 用 了 fdatasync 一 样 。 否 则 ， 如 果 op 参数 设 定 为 O SYNC, 
那么 操作 执行 起 来 就 会 像 调 用 了 fsync 一 样 。 

ff aio read 和 aio_write 函数 一 样 ， 在 安排 了 同步 时 ，aio_fsvync 操作 返回 。 在 异步 
同步 操作 完成 之 前 ， 数 据 不 会 被 持久 化 。AIO 控制 块 控制 我 们 如 何 被 通知 ， 就 像 aio_read 和 
aio write 函数 一 样 。 

为 了 获知 一 个 异步 读 、 写 或 者 同步 操作 的 完成 状态 ， 需 要 调用 aio_error AR. 


#include <aio.h> 


int aio error(const struct aiocb *aiocb) ; 





返回 值 为 下 面 4 种 情况 中 的 一 种 。 


0 异步 操作 成 功 完 成 。 需 要 调用 aio_return 函数 获取 操作 返回 值 。 

-1 对 aio error 的 调用 失败 。 这 种 情况 下 ，errno 会 告诉 我 们 为 什么 。 
EINPROGRESS ”异步 读 、 写 或 同步 操作 仍 在 等 待 。 

其 他 情况 其 他 任何 返回 值 是 相关 的 异步 操作 失败 返回 的 错误 码 。 


如 果 异 步 操 作成 功 ， 可 以 调用 aio return 函数 来 获取 异步 操作 的 返回 值 。 


#include <aio.h> 


ssize_t aio_return(const struct aiocb *aiocb) ; 





直到 异步 操作 完成 之 前 , 都 需要 小 心 不 要 调用 aio_return 函数 。 操作 完成 之 前 的 结果 是 未 
定义 的 。 还 需要 小 心 对 每 个 异步 操作 只 调用 一 次 aio_return。 一 旦 调用 了 该 函数 ,操作 系统 就 
可 以 释放 掉包 含 了 IO 操作 返回 值 的 记录 。 

如 果 aio return 函数 本 身 失 败 ， 会 返回 -1， 并 设置 errno。 其 他 情况 下 ， 它 将 返回 异步 
操作 的 结果 ， 即 会 返回 read. write 或 者 fsync 在 被 成 功 调用 时 可 能 返回 的 结果 。 513 
执行 VO 操作 时 ， 如 果 还 有 其 他 事务 要 处 理 而 不 想 被 IO 操作 阻塞 ,就 可 以 使 用 异步 TO。 然 
而 ， 如 果 在 完成 了 所 有 事务 时 ， 还 有 异步 操作 未 完成 时 ， 可 以 调用 aio suspend 函数 来 阻塞 进 

程 ， 直 到 操作 完成 。 


#include <aio.h> 





int aio suspend(const struct aiocb *const list{], int nent, 


const struct timespec *fimeout) ; 





返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 

aio suspend 可 能 会 返回 三 种 情况 中 的 一 种 。 如 果 我 们 被 一 个 信号 中 断 ， 它 将 会 返回 -1， 
并 将 errno 设置 为 EINTR。 如 果 在 没有 任何 VO 操作 完成 的 情况 下 ， 阻 塞 的 时 间 超 过 了 函数 中 
可 选 的 timeout 参数 所 指定 的 时 间 限 制 ， 那 么 aio suspend 将 返回 -1， 并 将 errno 设置 为 
EAGAIN (不 想 设 置 任何 时 间 限 制 的 话 ， 可 以 把 空 指针 传 给 timeout 参数 )。 如 果 有 任何 VO 操作 完 
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成 ，aio_suspend 将 返回 0。 如 果 在 我 们 调用 aio suspend 操作 时 ,所 有 的 异步 VO 操作 都 已 
完成 ， 那 么 aio_suspend 将 在 不 阻塞 的 情况 下 直接 返回 。 

list 参数 是 一 个 指向 AIO 控制 块 数组 的 指针 ，nent 参数 表明 了 数组 中 的 条 目 数 。 数 组 中 的 空 
指针 会 被 跳 过 ， 其 他 条 目 都 必须 指向 已 用 于 初始 化 异步 IO 操作 的 AIO 控制 块 。 





返回 值 ，( 见 下 》 

如 参数 指定 了 那个 未 完成 的 异步 VO 操作 的 文件 描述 符 。 如 果 aioch 参数 为 NULL， 系 统 将 会 尝试 
取消 所 有 该 文件 上 未 完成 的 异步 VO 操作 。 其 他 情况 下 , 系统 将 尝试 取消 由 AIO 控制 块 描述 的 单个 异步 
VO 操作 。 我 们 之 所 以 说 系统 “尝试 ”取消 操作 ， 是 因为 无 法 保证 系统 能 够 取消 正在 进程 中 的 任何 操作 。 

aio cancel 函数 可 能 会 返回 以 下 4 个 值 中 的 一 个 。 

AIO_ALLDONE 所 有 操作 在 尝试 取消 它们 之 前 已 经 完成 。 

AIO_CANCELED 所 有 要 求 的 操作 已 被 取消 。 

AIO NOTCANCELED ”至 少 有 一 个 要 求 的 操作 没有 被 取消 。 

-1 对 aio cancel 的 调用 失败 ， 错 误 码 将 被 存储 在 errno 中 。 

如 果 异 步 VO 操作 被 成 功 取消 ， 对 相应 的 AIO 控制 块 调 用 aio error 函数 将 会 返回 错误 
ECANCELED。 如 果 操 作 不 能 被 取消 , 那么 相应 的 AIO 控制 块 不 会 因为 对 aio_cancel 的 调用 而 被 修改 。 

还 有 一 个 函数 也 被 包含 在 异步 VO 接口 当中 ， 尽 管 它 既 能 以 同步 的 方式 来 使 用 ， 又 能 以 异步 的 方 
式 来 使 用 ， 这 个 函数 就 是 1io_1istio。 该 函数 提交 一 系列 由 一 个 AIO 控制 块 列表 描述 的 VO 请 求 。 


#include <aio.h> 


int lio listio(int mode, struct aiocb *restrict const list[restrict], 


int nent, struct sigevent *restrict sigev); 


返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 





mode 参数 决定 了 VO 是 否 真 的 是 异步 的 。 如 果 该 参数 被 设 定 为 LIO_WRAIT，1lio_ listio Ř 
数 将 在 所 有 由 列表 指定 的 IO 操作 完成 后 返回 。 在 这 种 情况 下 ，sigev 参数 将 被 忽略 。 如 果 mode 
参数 被 设 定 为 LIO_NOWAIT, lio listio 函数 将 在 VO 请 求 入 队 后 立即 返回 。 进 程 将 在 所 有 IO 
操作 完成 后 , 按照 sigev 参数 指定 的 , 被 异步 地 通知 。 如 果 不 想 被 通知 , 可 以 把 sigev WE NULL. 
注意 ， 每 个 AIO 控制 块 本 身 也 可 能 启用 了 在 各 自 操 作 完 成 时 的 异步 通知 。 被 sigev 参数 指定 的 异 
步 通知 是 在 此 之 外 另 加 的 ， 并 且 只 会 在 所 有 的 VO 操作 完成 后 发 送 。 

list 参数 指向 AIO 控制 块 列 表 ， 该 列表 指定 了 要 运行 的 IO 操作 的 。nent 参数 指定 了 数组 中 
的 元 素 个 数 。AIO 控制 块 列 表 可 以 包含 NULL 指针 ， 这 些 条 目 将 被 忽略 。 

在 每 一 个 AIO 控制 块 中 ，aio_1io_opcode 字段 指定 了 该 操作 是 一 个 读 操作 (LIO_RERAD)、 写 操 
作 (LIO WRITE)， 还 是 将 被 忽略 的 空 操作 (LIO_NOP)。 读 操作 会 按照 对 应 的 AIO 控制 块 被 传 给 了 
aio_read 函数 来 处 理 。 类 似 地 ， 写 操作 会 按照 对 应 的 AIO 控制 块 被 传 给 了 aio_write 函数 来 处 理 。 

实现 会 限制 我 们 不 想 完 成 的 异步 UO 操作 的 数量 。 这 些 限制 都 是 运行 时 不 变量 ， 其 总 结 如 
图 14-19 所 示 。 

可 以 通过 调用 sysconf 函数 并 把 name 参数 设置 为 SC_IO_LISTIO_MAX 来 设 定 AIO_ 
LISTIO MAX 的 值 。 类 似 地 ， 可 以 通过 调用 sysconf 并 把 name 参数 设置 为 _ SC_AIO_MAX Rix 
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定 AIO MAX 的 值 ， 通 过 调用 sysconf 并 把 其 参数 设置 为 SC_AIO_PRIO_DELTR_MAX 来 设 定 
AIO_PRIO_DELTA MAX 的 值 。 


AIO_LISTIO_MAX 单个 列表 VO 调用 中 的 最 大 vo 操作 数 POSIX AIO LISTIO MAX (2) 
AIO MAX 未 完成 的 异步 VO 操作 的 最 大 数目 POSIX AIO MAX (1) 
AIO PRIO DELTA MAX | 进程 可 以 减少 的 其 异步 VO 优先 级 的 最 大 值 | 0 


图 14-19 POSIX.1 中 的 异步 WO 运行 时 不 变量 的 值 515 
引入 POSIX 异步 操作 VO 接口 的 初 囊 是 为 实时 应 用 提供 一 种 方法 ， 避 免 在 执行 VO 操作 时 阻 
塞 进程 。 接 下 来 就 让 我 们 来 看 一 个 使 用 这 些 接口 的 例子 。 


时 实例 

虽然 我 们 不 会 在 本 文中 讨论 实时 编程 ， 但 因为 POSIX HA VO 接口 现在 是 Single UNIX 
Specification 的 基本 部 分 ,所 以 我 们 要 了 解 一 下 怎么 使 用 它们 。 为 了 对 比 异 步 IO 接口 和 相应 的 传 
BVO 接口 ， 我 们 来 研究 一 个 任务 ， 将 一 个 文件 从 一 种 格式 翻译 成 另 一 种 格式 。 

图 14-20 中 展示 的 程序 ， 使 用 20 世纪 80 年 代 流 行 的 USENET 新 闻 系 统 中 使 用 的 ROT-13 算 
法 ， 翻 译文 件 ， 该 算法 原本 用 于 将 文本 中 的 带 有 侵犯 性 的 或 者 含有 剧 透 和 笑话 笑 点 部 分 的 文本 模 
糊 化 。 该 算法 将 文本 中 的 英文 字符 az 和 A~Z 分 别 循环 向 右 偏 移 13 个 字母 位 移 ， 但 不 改变 其 
他 字符 。 
#include "apue.h" 


#include <ctype.h> 
#include «fcntl.h» 












#define BSZ 4096 


unsigned char buf[BSZ]; 


unsigned char 
translate(unsigned char c) 
{ 
if (isalpha(c)) { 
if (e »- n") 
c -= 13; 
else if (c >= 'a') 
c += 13; 
else if (c >= 'N') 
ce == 13; 
else 
c += 13; 
) 
return(c); 


int 
main(int argc, char* argv[]) 
{ 
int ifd, ofd, i, n, nw; 516 
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if (argc != 3) 
err quit("usage: zot13 infile outfile"); 

if ((ifd = open(argv[1], O RDONLY)) < 0) 
err sys("can't open $s", argv[1]); 

if ((ofd = open(argv[2], O RDWR|O CREAT|O TRUNC, FILE MODE)) < 0) 
err sys("can't create $s", argv[2]); 


while ((n = read(ifd, buf, BSZ)) > 0) ( 
for (i = Of i < np rrt) 
buf[i] = translate (buf[i]); 
if ((nw = write(ofd, buf, n)) != n) { 
if (nw < 0) 
err_sys("write failed"); 
else 
err quit ("short write (%d/%d)", nw, n); 


fsync(ofd); 
exit (0); 


14-20 ”用 ROT-13 翻译 一 个 文件 
程序 中 的 VO 部 分 是 很 直接 的 : 从 输入 文件 中 读 取 一 个 块 ， 翻 译 之 ， 然 后 再 把 这 个 块 写 到 输 


出 文件 中 。 重 复 该 步骤 直到 遇 到 文件 尾 端 ，read 返回 0。 图 14-21 中 的 程序 展示 了 如 何 使 用 等 价 
的 异步 VO 函数 做 同样 的 任务 。 


#include "apue.h" 
#include <ctype.h> 
#include «fcntl.h» 
#include <aio.h> 
#include <errno.h> 


#define BSZ 4096 
#define NBUF 8 


enum rwop { 


}; 


UNUSED = 0, 
READ PENDING = 1, 
WRITE PENDING - 2 


struct buf { 


}; 


enum rwop op; 
int last; 
struct aiocb aiocb; 
unsigned char data[BSZ]; 


struct buf bufs[NBUF]; 
unsigned char 
translate(unsigned char c) 


{ 


/* same as before */ 


int 
main(int argc, char* argv[]) 


{ 


int ifd, ofd, i, j, n, err, numop; 
struct stat sbuf; 

const struct aiocb *aiolist[NBUF]; 

off t off = 0; 


if (argc !- 3) 
err quit("usage: rotl3 infile outfile"); 
if ((ifd = open(argv[1], O RDONLY)) < 0) 
err sys("can't open $s", argv[1]); 
if ((ofd = open(argv[2], O RDWR|O CREAT|O TRUNC, FILE MODE)) < 0) 
err sys("can't create $s", argv[2]); 
if (fstat(ifd, &sbuf) < 0) 
err sys("fstat failed"); 


/* initialize the buffers */ 

for (i = 0; i < NBUF; i++) 1 
bufs[i].op = UNUSED; 
bufs[i].aiocb.aio_buf = bufs[i].data; 
bufs[i].aiocb.aio_sigevent.sigev_notify = SIGEV_NONE; 
aiolist[i] = NULL; 


numop = 0; 
for (77) { 
for (i = 0; i < NBUE; i++) { 
switch (bufs[i].op) { 
case UNUSED: 
/* 

* Read from the input file if more data 

* remains unread. 

*4 

if (off « sbuf.st size) { 
bufs[i].op = READ PENDING; 
bufs[i].aiocb.aio fildes ifd; 
bufs[i].aiocb.aio offset - off; 
off += BSZ; 
if (off >= sbuf.st size) 
bufs[i].last = 1; 
bufs[i].aiocb.aio nbytes - BSZ; 
if (aio read(&bufs[i].aiocb) < 0) 
err sys("aio read failed"); 

aiolist[i] = &bufs[i].aiocb; 
numopt++; 


} 


break; 


case READ_PENDING: 
if ((err = aio_error (&bufs[i].aiocb)) == EINPROGRESS) 
continue; 
if (err != 0) { 
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if (err == -1) 

err_sys ("aio error failed"); 
else 

err exit (err, "read failed"); 


/* 
* A read is complete; translate the buffer 
* and write it. 
xy 
if ((n » aio return(&bufs[i].aiocb)) « 0) 
err sys("aio return failed"); 
if (n != BSZ && !bufs[i].last) 
err quit("short read (%d/%d)", n, BSZ); 
for G = 0p j«mn; jtt) 
bufs[i].data[j] = translate(bufs[i].data[j]); 
bufs[i].op = WRITE PENDING; 
bufs[i].aiocb.aio fildes ofd; 
bufs[i].aiocb.aio nbytes = n; 
if (aio write(&bufs[i].aiocb) « O0) 
err sys("aio write failed"); 


/* retain our spot in aiolist */ 
break; 


case WRITE PENDING: 


if ((err = aio error(&bufs[i].aiocb)) -- EINPROGRESS) 
continue; 

if (err != 0) { 
if (err == -1) 


err_sys("aio_error failed"); 
else 
err_exit(err, "write failed"); 


/* 
* A write is complete; mark the buffer as unused. 
*/ 
if ((n = aio return(&bufs[i].aiocb)) < 0) 
err sys("aio return failed"); 
if (n != bufs[i].aiocb.aio_nbytes) 
err quit("short write ($d/$d)", n, BSZ); 





aiolist[i] - NULL; 
bufs[i].op = UNUSED; 
numop--; 
break; 


} 
if (numop == 0) { 
if (off >= sbuf.st_size) 
break; 
} else { 
if (aio_suspend(aiolist, NBUF, NULL) < 0) 
err sys("aio suspend failed"); 
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bufs[0].aiocb.aio fildes = ofd; 

if (aio_fsync(O_SYNC, &bufs[0].aiocb) < 0) 
err_sys("aio_fsync failed"); 

exit (0); 





14-21. 用 ROT13 和 异步 IO 翻译 一 个 文件 

注意 ， 我 们 使 用 了 8 个 缓冲 区 ， 因 此 可 以 有 最 多 8 个 异步 IO 请 求 处 于 等 待 状态 。 令 人 惊讶 
的 是 ， 实 际 上 这 可 能 会 降低 性 能 ， 因 为 如 果 读 操作 是 以 无 序 的 方式 提交 给 文件 系统 的 ， 操 作 系 统 
提前 读 的 算法 便 会 失效 。 

在 检查 操作 的 返回 值 之 前 ， 必 须 确认 操作 已 经 完成 。 当 aio_error 返回 的 值 既 非 了 INPROGRESS 
亦 非 -1 时 ， 表 明 操 作 完成 。 除 了 这 些 值 之 外 ， 如 果 返 回 值 是 0 以 外 的 任何 值 ， 说 明 操 作 失 败 了 。 一 
且 检 查 过 这 些 情况 ， 便 可 以 安全 地 调用 aio_return 来 获取 VO 操作 的 返回 值 了 。 

只 要 还 有 事情 要 做 ， 就 可 以 提交 异步 IO 操作 。 当 存在 未 使 用 的 AIO 控制 块 时 ， 可 以 提交 一 
个 异步 读 操作 。 读 操作 完成 后 ， 翻 译 缓冲 区 中 的 内 容 并 将 它 提交 给 一 个 异步 写 请 求 。 当 所 有 AIO 
控制 块 都 在 使 用 中 时 ， 通 过 调用 aio_suspend 等 待 操作 完成 。 

在 把 一 个 块 写 入 输出 文件 时 ， 我 们 保留 了 在 从 输入 文件 读 取 数 据 时 的 偏 移 量 。 因 而 写 的 顺序 
并 不 重要 。 这 一 策略 仅 在 输入 文件 中 每 个 字符 和 输出 文件 中 对 应 的 字符 的 偏 移 量 相同 的 情况 下 适 
用 ， 我 们 在 输出 文件 中 既 没 有 添加 字符 也 没有 删除 字符 。 

这 个 实例 中 并 没有 使 用 异步 通知 ， 因 为 使 用 同步 编程 模型 更 加 简单 。 如 果 在 IO 操作 进行 时 
还 有 别 的 事情 要 做 ,那么 额外 的 工作 可 以 包含 在 for 循环 当中 。 然 而 ， 如 果 需 要 阻止 这 些 额 外 的 
工作 延迟 翻译 文件 的 任务 ， 那 么 就 需要 组 织 下 代码 使 用 异步 通知 。 多 任务 情况 下 ， 决 定 程序 如 何 
建构 之 前 需要 先 考虑 各 个 任务 的 优先 级 。 m 
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readv 和 writev 函数 用 于 在 一 次 函数 调用 中 读 、 写 多 个 非 连续 缓冲 区 。 有 时 也 将 这 两 个 函 
数 称 为 散布 读 (scatter read) 和 聚集 写 (gather write). 


#include <sys/uio.h> 





ssize_t readv(int fd, const struct iovec *iov, int iovent) ; 


ssize t writev(int fd, const struct iovec *iov, int iovent) ; 


两 个 函数 的 返回 值 ， 已 读 或 已 写 的 字 节 数 ， 若 出 错 ， 返 回 -1 
这 两 个 函数 的 第 二 个 参数 是 指向 iovec 结构 数组 的 一 个 指针 : 





struct iovec { 

void  *iov base; /* starting address of buffer */ 

size t iov len; /* size of buffer */ 
fF 
iov 数组 中 的 元 素数 由 iovcmt 指定 ， 其 最 大 值 受 限于 rov Max 【回忆 图 2-11)。 图 14-22 显示 
了 这 两 个 函数 的 参数 和 iovec 结构 之 间 的 关系 。 

writev 函数 从 缓冲 区 中 聚集 输出 数据 的 顺序 是 : iov[0] 、iov[1] 直至 iov[iovcnt-1]。 

writev 返回 输出 的 字 节 总 数 ， 通 常 应 等 于 所 有 缓冲 区 长 度 之 和 。 
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iou[0] .iov_base 十 -一 一 ~ 缓冲 区 0 
iov[0].iov len Kn o md 长 度 0 —- 
iov[1].iov base 

idi 
iov[1].iov len 长 度 1 


F—— KEI — 

















iov[iovcni-1].iov base 十 -| 缓冲 区 NN 


iov[iovcnt-1].iov len KHEN EF—— — KEN — — — | 
图 14-22 readv 和 writev 的 iovec 结构 
readv 函数 则 将 读 入 的 数据 按 上 述 同 样 顺 序 散 布 到 缓冲 区 中 。readv 总 是 先 填 满 一 个 缓冲 
区 ,然后 再 填写 下 一 个 。readv 返回 读 到 的 字 节 总 数 。 如 果 遇 到 文件 尾 端 ， 已 无 数据 可 读 ， 则 返 
回 0。 














这 两 个 函数 始 于 4.2BSD,， 后 来 ，SVR4 也 提供 它们 。 在 Single UNIX Specification 的 XSI 
扩展 中 包括 了 这 两 个 函数 。 


m 9c Bl 


fr 20.8 35H] db writeidx 函数 中 ， 需 将 两 个 缓冲 区 中 的 内 容 连 续 地 写 到 一 个 文件 中 。 第 
二 个 缓冲 区 是 调用 者 传递 过 来 的 一 个 参数 ， 第 一 个 缓冲 区 是 我 们 创建 的 ， 它 包含 了 第 二 个 缓冲 的 
长 度 以 及 文件 中 其 他 信息 的 文件 偏 移 量 。 有 以 下 3 种 方法 可 以 实现 这 一 要 求 。 

CD 调用 两 次 write， 每 个 缓冲 区 一 次 。 

(2) 分 配 一 个 大 到 足以 包含 两 个 缓冲 区 的 新 缓冲 区 。 将 两 个 缓冲 区 的 内 容 复 制 到 新 缓冲 区 中 。 
然后 对 这 个 新 缓冲 区 调用 一 次 write。 

(3) 调用 writev 输出 两 个 缓冲 区 。 

20.8 节 的 解决 方案 使 用 了 writev， 但 是 将 它 与 另外 两 种 方法 进行 比较 ， 对 我 们 是 很 有 启发 
的 。 图 14-23 显示 了 上 面 所 述 3 种 方法 的 结果 。 


两 次 write 0.06 2.04 2.13 0.85 8.33 13.83 
缓冲 区 复制 ， 然 后 一 次 write 0.03 } 1.16 0.70 4.87 9.25 
一 次 writev 0.04 1.21 1.26 0.43 5.34 9.24 


图 14-23 ”比较 writev 和 其 他 技术 所 得 的 时 间 结 果 
用 于 测量 的 测试 程序 输出 一 个 100 字 节 的 头 文件 ， 接 着 又 输出 200 字 节 的 数据 。 这 样 做 1 048 576 





次 ， 产 生 了 一 个 300 MB 的 文件 。 该 测试 程序 有 3 个 版 本 一 一 针对 图 14-23 中 的 每 一 种 测量 技术 
编写 了 一 个 版 本 。 使 用 times (A 8.17 节 ) 测 得 它们 在 写 操作 前 、 后 各 使 用 的 用 户 CPU 时 间 、 
系统 CPU 时 间 和 时 钟 时 间 。 这 3 个 时 间 的 单位 都 是 秒 。 

正如 我 们 所 预料 的 ， 调 用 两 次 write 的 系统 时 间 比 调用 一 次 write 或 writerv 的 长 ， 这 与 
3-6 的 结果 类 似 。 

接着 要 注意 的 是 ， 在 缓冲 区 复制 后 跟随 一 个 write 所 用 的 CPU 时 间 (用户 时 间 加 系统 时 间 ) 要 
少 于 调用 一 次 writev 所 耗费 的 CPU 时 间 。 对 于 单一 write 的 情况 , 我 们 先 将 用 户 层次 的 两 个 缓冲 
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区 复制 到 一 个 分 段 缓冲 区 (staging buffer)， 然 后 在 调用 write 时 内 核 将 该 分 段 缓冲 区 中 的 数据 
复制 到 其 内 部 缓冲 区 。 对 于 writev 的 情况 ， 因 为 内 核 只 需 将 数据 直接 复制 进 其 分 段 缓 冲 区 ， 所 
以 复制 工作 应 当 会 少 一 些 。 但 是 ， 对 于 这 种 少量 数据 ， 使 用 writev 的 固定 成 本 大 于 收益 。 随 着 
需 复制 数据 的 增加 ， 程 序 中 复制 缓冲 区 的 成 本 也 会 增多 ， 此 时 ，writev 这 种 替代 方法 将 更 具 吸 
引力 。 





不 要 依据 图 14-23 中 的 数字 对 Linux 和 Mac OS X 之 间 的 相对 性 能 作 过 多 的 推断 。 这 两 种 计算 
机 有 很 大 差别 : 它们 有 不 同 的 处 理 器 结构 、 不 同 数量 的 RAM 以 及 不 同 速度 的 磁盘 。 为 了 在 操作 
系统 之 间 进 行 公 平 的 比较 ， 需 要 对 每 一 种 操作 系统 都 使 用 相同 的 硬件 。 a 


总 之 ， 应 当 用 尽量 少 的 系统 调用 次 数 来 完成 任务 。 如 果 我 们 只 写 少 量 的 数据 ， 将 会 发 现 自己 
复制 数据 然后 使 用 一 次 write REH writev 更 合算 。 但 也 可 能 发 现 ， 我 们 管理 自己 的 分 段 组 
冲 区 会 增加 程序 额外 的 复杂 性 成 本 ， 所 以 从 性 能 成 本 的 角度 来 看 不 合算 。 


14.7 PAR readn 和 writen 


管道 、FIFO 以 及 某 些 设备 (特别 是 终端 和 网 络 ) 有 下 列 两 种 性 质 。 

(1) 一 次 read 操作 所 返回 的 数据 可 能 少 于 所 要 求 的 数据 ， 即 使 还 没 达到 文件 尾 端 也 可 能 是 
这 样 。 这 不 是 一 个 错误 ， 应 当 继 续 读 该 设备 。 

(2) 一 次 write 操作 的 返回 值 也 可 能 少 于 指定 输出 的 字 节 数 。 这 可 能 是 由 某 个 因素 造成 的 ， 
例如 ， 内 核 输出 缓冲 区 变 满 。 这 也 不 是 错误 ， 应 当 继 续 写 余下 的 数据 。( 通 常 ， 只 有 非 阻塞 描述 
符 ， 或 捕捉 到 一 个 信号 时 ， 才 发 生 这 种 write 的 中 途 返回 。) 

在 读 、 写 磁盘 文件 时 从 未 见 到 过 这 种 情况 ,除非 文件 系统 用 完了 空间 , 或 者 接近 了 配额 限制 ， 
不 能 将 要 求 写 的 数据 全 部 写 出 。 

通常 ， 在 读 、 写 一 个 管道 、 网 络 设备 或 终端 时 ， 需 要 考虑 这 些 特 性 。 下 面 两 个 函数 readn 
和 writen 的 功能 分 别 是 读 、 写 指定 的 YX 字 节 数 据 ， 并 处 理 返 回 值 可 能 小 于 要 求 值 的 情况 。 这 两 
个 函数 只 是 按 需 多 次 调用 read 和 write 直至 读 、 写 了 N 字 节 数 据 。 


#include "apue.h" 





ssize t readn(int fd, void *buf, size t nbytes); 
ssize t writen (int fd, void *buf, size t nbytes); 


两 个 函数 的 返回 值 : 读 、 写 的 字 节 数 ， 若 出 错 ， 返 回 -1 








类 似 于 本 书 很 多 实例 所 使 用 的 出 错 处 理 例 程 ， 我 们 定义 这 两 个 函数 的 目的 是 便于 在 后 面 实 例 
中 使 用 。readn 和 writen 函数 并 不 是 哪个 标准 的 组 成 部 分 。 
在 要 将 数据 写 到 上 面 提 到 的 文件 类 型 上 时 ， 就 可 调用 writen， 但 是 仅 当 事 先 就 知道 要 接收 
数据 的 数量 时 ， 才 调用 readn. 14-24 包含 了 readn 和 writen 的 实现 ， 在 后 面 的 实例 中 ， 
我 们 还 会 用 到 。 523 


#include "apue.h" 











ssize_t /* Read "n" bytes from a descriptor */ 
readn(int fd, void *ptr, size_t n) 


{ 
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size_t nleft; 
ssize_t nread; 


nleft = n; 
while (nleft > 0) { 
if ((nread = read(fd, ptr, nleft)) < 0) ( 
if (nleft == n) 
return(-1); /* error, return -1 */ 
else 
break; /* error, return amount read so far */ 
) else if (nread == 0) { 
break; /* EOF */ 
} 
nleft -= nread; 
ptr += nread; 
} 


return(n - nleft); /* return >= 0 */ 


} 


ssize t /* Write "n" bytes to a descriptor */ 


writen(int fd, const void *ptr, size t n) 


{ 


size_t nleft; 
ssize_t nwritten; 
nleft = n; 


while (nleft > 0) { 
if ((nwritten = write(fd, ptr, nleft)) < 0) { 
if (nleft == n) 
return(-1); /* error, return -1 */ 


else 
break; /* error, return amount written so far */ 
) else if (nwritten == 0) { 
break; 
} 
nleft -= nwritten; 


ptr += nwritten; 


} 
return(n - nleft); /* return >= 0 */ 
14-24. readn 和 writen 函数 
注意 ， 若 在 已 经 读 、 写 了 一 些 数据 之 后 出 错 ， 则 这 两 个 函数 返回 的 是 已 传输 的 数据 量 ， 而 非 
错误 。 与 此 类 似 ， 在 读 时 ， 如 达到 文件 尾 端 ， 而 且 在 此 之 前 已 成 功 地 读 了 一 些 数据 ， 但 尚未 满足 
所 要 求 的 量 ， 则 readn 返回 已 复制 到 调用 者 缓冲 区 中 的 字 节 数 。 


14.8 存储 映射 1O 


存储 映射 VO (memory-mapped /O) 能 将 一 个 磁盘 文件 映射 到 存储 空间 中 的 一 个 缓冲 区 上 ， 
于 是 ， 当 从 缓冲 区 中 取 数 据 时 ， 就 相当 于 读 文 件 中 的 相应 字 节 。 与 此 类 似 , 将 数据 存 入 缓冲 区 时 ， 
相应 字 节 就 自动 写 入 文件 。 这 样 ， 就 可 以 在 不 使 用 read 和 write 的 情况 下 执行 VO. 
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存储 映射 VO 伴随 虚拟 存储 系统 已 经 用 了 很 多 年 。1981 年 ，4.1BSD 以 其 vread 和 vwrite 
| 通 数 提供 了 一 种 不 同形 式 的 存储 映射 JO。4.2BSD 中 删除 了 这 两 个 函数 ， 试 图 替换 成 mmap BK, 
但 是 4.2BSD 实际 上 并 没有 包含 mmap 函数 ( 原因 见 McKusick 等 [1996] 中 2.5 节 的 描述 ) Gingell, 
Moran 和 Shannon[1987] 描 述 了 mmap 的 一 种 实现 。SUSv4 把 mmap 函数 从 可 选项 规范 中 移 到 了 基 
础 规范 中 。 所 有 的 遵循 POSIX 的 系统 都 需要 支持 它 。 


为 了 使 用 这 种 功能 ， 应 首先 告诉 内 核 将 一 个 给 定 的 文件 映射 到 一 个 存储 区 域 中 。 这 是 由 mmap 





#include <sys/mman.h> 


void *mmap(void *addr, size t len, int prot, int flag, int fd, off t off); 
返回 值 : 若 成 功 ， 返 回 映射 区 的 起 始 地 址 ; 若 出 错 ， 返 回 MAP FAILED 


addr 参数 用 于 指定 映射 存储 区 的 起 始 地 址 。 通 常 将 其 设置 为 0， 这 表示 由 系统 选择 该 映射 区 
的 起 始 地 址 。 此 函数 的 返回 值 是 该 映射 区 的 起 始 地 址 。 

fd 参数 是 指定 要 被 映射 文件 的 描述 符 。 在 文件 映射 到 地 址 空间 之 前 ， 必 须 先 打开 该 文件 。len 参 
数 是 映射 的 字 节 数 ，of 是 要 映射 字 节 在 文件 中 的 起 始 偏 移 量 (有关 off 值 的 一 些 限 制 将 在 后 面 说 明 )。 

prot 参数 指定 了 映射 存储 区 的 保护 要 求 ， 如 图 14-25 所 示 。 





PROT_READ 映射 区 可 读 


PROT_WRITE 映射 区 可 写 
PROT_EXEC 映射 区 可 执行 
PROT_NONE 映射 区 不 可 访问 





图 14-25 ”映射 存储 区 的 保护 要 求 


可 将 prot 参数 指定 为 PROT_NONE， 也 可 指定 为 PROT READ. PROT WRITE 和 PROT EXEC 
的 任意 组 合 的 按 位 或 。 对 指定 映射 存储 区 的 保护 要 求 不 能 超过 文件 open 模式 访问 权限 。 例 如 ， 
若 该 文件 是 只 读 打 开 的 ， 那 么 对 映射 存储 区 就 不 能 指定 PROT_WRITE。 
在 说 明 flag 参数 之 前 ， 先 看 一 下 存储 映射 文件 的 基本 情况 。 图 14-26 显示 了 一 个 存储 映射 文 
件 。( 见 图 7-6 中 所 示 的 典型 进程 的 存储 器 安排 。) 在 此 图 中 ,“ 起 始 地 址 ”是 mmap 的 返回 值 。 映 
射 存 储 区 位 于 堆 和 栈 之 间 : 这 属于 实现 细节 ， 各 种 实现 之 间 可 能 不 同 。 
下 面 是 flag 参数 影响 映射 存储 区 的 多 种 属性 。 
MAP_FIXED 返回 值 必须 等 于 addr。 因 为 这 不 利于 可 移植 性 ， 所 以 不 鼓励 使 用 此 标志 。 
如 果 未 指定 此 标志 ， 而 且 addr 非 0， 则 内 核 只 把 addr 视 为 在 何 处 设置 映 
射 区 的 一 种 建议 ， 但 是 不 保证 会 使 用 所 要 求 的 地 址 。 将 addr 指定 为 0 可 
获得 最 大 可 移植 性 。 
在 遵循 POSIX 的 系统 中 , 对 MAP_FIXED 标志 的 支持 是 可 选择 的 , 但 遵循 XSI 的 系统 则 
要 求 支持 MAP_FIXED。 


MAP_SHARED 这 一 标志 描述 了 本 进程 对 映射 区 所 进行 的 存储 操作 的 配置 。 此 标志 指定 
存储 操作 修改 映射 文件 ， 也 就 是 ， 存 储 操作 相当 于 对 该 文件 的 write。 
必须 指定 本 标志 或 下 一 个 标志 (MAP_PRIVATE)， 但 不 能 同时 指定 两 者 。 

MAP PRIVATE 本 标志 说 明 ， 对 映射 区 的 存储 操作 导致 创建 该 映射 文件 的 一 个 私有 副本 。 
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所 有 后 来 对 该 映射 区 的 引用 都 是 引用 该 副本 。( 此 标志 的 一 种 用 途 是 用 于 
调试 程序 ， 它 将 程序 文件 的 正文 部 分 映射 至 存储 区 ， 但 允许 用 户 修改 其 
中 的 指令 。 任 何 修改 只 影响 程序 文件 的 副本 ， 而 不 影响 原文 件 。) 

高 地 址 





文件 的 存储 à 
映射 部 分 i 


len 


A EE A tee 








未 初始 化 的 数据 


(bss) 


已 初始 化 的 数据 
正文 








低地 址 





图 14-26 存储 映射 文件 的 例子 
每 种 实现 都 可 能 还 有 男 外 一 些 MAP xxx 标志 值 ， 它 们 是 那 种 实现 所 特有 的 。 详 细 情 况 请 参 
见 你 所 使 用 系统 的 mmap(2) 手 册页 。 
co 六 的 值 和 addr 的 值 ( 如 果 指 定 了 MAP_FIXED) 通常 被 要 求 是 系统 虚拟 存储 页 长 度 的 倍数 。 
虚拟 存储 页 长 可 用 带 参数 _SC_PAGESIZE 或 SC PAGE SIZE 的 sysconf MM (IL 2.5.4 节 ) 得 
到 。 因 为 of 和 addr 常常 指定 为 0， 所 以 这 种 要 求 一 般 并 不 重要 。 


这 一 要 求 通常 是 由 系统 实现 强加 的 。 尽 管 Single UNIX Specification 不 再 要 求 满足 该 条 件 ， 但 
”是 所 有 本 书 中 讲 到 的 除了 FreeBSD 8.0 以 外 的 所 有 平台 都 满足 了 这 一 和 要求 。FreeBSD 8.0 允许 我 们 
使 用 任意 的 地 址 对 齐 和 偏 移 对 齐 ， 只 要 对 齐 匹 配 即 可 。 


既然 映射 文件 的 起 始 偏 移 量 受 系统 虚拟 存储 页 长 度 的 限制 ， 那 么 如 果 映 射 区 的 长 度 不 是 页 长 
的 整数 倍 时 ， 会 怎么 样 呢 ? 假定 文件 长 为 12 字 节 ， 系 统 页 长 为 512 字 节 ， 则 系统 通常 提供 512 
字 节 的 映射 区 ， 其 中 后 500 字 节 被 设置 为 0。 可 以 修改 后 面 的 这 500 字 节 ， 但 任何 变动 都 不 会 在 
文件 中 反映 出 来 。 于 是 ， 不 能 用 mmap 将 数据 添加 到 文件 中 。 我 们 必须 先 加 长 该 文件 ， 如 后 面 的 
图 14-27 中 的 程序 所 示 。 

与 映射 区 相关 的 信号 有 SIGSEGV 和 SIGBUS. 信号 SIGSEGV 通常 用 于 指示 进程 试图 访问 对 
它 不 可 用 的 存储 区 。 如 果 映 射 存 储 区 被 mmap 指定 成 了 只 读 的 ， 那 么 进程 试图 将 数据 存 入 这 个 映 
射 存储 区 的 时 候 ， 也 会 产生 此 信号 。 如 果 映 射 区 的 某 个 部 分 在 访问 时 已 不 存在 ， 则 产生 SIGBUS 
信号 。 例 如 ， 假 设 用 文件 长 度 映 射 了 一 个 文件 ， 但 在 引用 该 映射 区 之 前 ， 另 一 个 进程 已 将 该 文件 
截断 。 此 时 ， 如 果 进 程 试图 访问 对 应 于 该 文件 已 截 去 部 分 的 映射 区 ， 将 会 接收 到 SIGBUS 信号 。 

子 进程 能 通过 fork 继承 存储 映射 区 〈 因 为 子 进程 复制 父 进程 地 址 空间 ， 而 存储 映射 区 是 该 
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地 址 空间 中 的 一 部 分 )， 但 是 由 于 同样 的 原因 ， 新 程序 则 不 能 通过 exec 继承 存储 映射 区 。 
调用 mprotect 可 以 更 改 一 个 现 有 映射 的 权限 。 


#include <sys/mman.h> 





int mprotect (void *addr, size_t len, int prot); 





返回 值 : 若 成 功 ， 返 回 0;， 若 出 错 ， 返 回 -1 

prot 的 合法 值 与 mmap 中 protf 参 数 的 一 样 ( 见 图 14-25 )。 请 注意 ， 地 址 参数 addr 的 值 必须 是 
系统 页 长 的 整数 倍 。 

如 果 修 改 的 页 是 通过 MAP SHARED 标志 映射 到 地 址 空间 的 ， 那 么 修改 并 不 会 立即 写 回 到 文件 
中 。 相 反 ， 何 时 写 回 脏 页 由 内 核 的 守护 进程 决定 ， 决 定 的 依据 是 系统 负载 和 用 来 限制 在 系统 失败 
事件 中 的 数据 损失 的 配置 参数 。 因 此 ， 如 果 只 修改 了 一 页 中 的 一 个 字 节 ， 当 修改 被 写 回 到 文件 中 
时 ， 整 个 页 都 会 被 写 回 。 

如 果 共 享 映射 中 的 页 已 修改 ， 那 么 可 以 调用 msync 将 该 页 冲洗 到 被 映射 的 文件 中 。msync 
函数 类 似 于 fsync (A 3.13 节 )， 但 作用 于 存储 映射 区 。 


#include «sys/mman.h» 


int msync(void *addr, size_t len, int flags); 





返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 
如 果 映 射 是 私有 的 ， 那 么 不 修改 被 映射 的 文件 。 与 其 他 存储 映射 函数 一 样 ， 地 址 必须 与 页 边 
界 对 齐 。 
flags 参数 使 我 们 对 如 何冲 洗 存 储 区 有 某 种 程度 的 控制 。 可 以 指定 MS ASYNC 标志 来 简单 地 调 
试 要 写 的 页 。 如 果 希 望 在 返回 之 前 等 待 写 操作 完成 ， 则 可 指定 MS SYNC 标志 。 一 定 要 指定 
MS_ASYNC 和 MS_SYNC 中 的 一 个 。 
MS INVALIDATE 是 一 个 可 选 标 志 ， 人 允许 我 们 通知 操作 系统 丢弃 那些 与 底层 存储 器 没有 同步 
的 页 。 若 使 用 了 此 标志 ， 某 些 实现 将 丢弃 指定 范围 中 的 所 有 页 ， 但 这 种 行为 并 不 是 必需 的 。 
msync 函数 包含 在 Single UNIX Specification 的 XSI 选项 中 。 因 此 ， 所 有 UNIX 系统 必须 支持 它 。 


当 进 程 终止 时 ， 会 自动 解除 存储 映射 区 的 映射 ， 或 者 直接 调用 munmap 函数 也 可 以 解除 映射 
区 。 关 闭 映 射 存储 区 时 使 用 的 文件 描述 符 并 不 解除 映射 区 。 


#include <sys/mman.h> 


int munmap (void *addr, size_t len); 





munmap 并 不 影响 被 映射 的 对 象 ， 也 就 是 说 ， 调 用 munmap 并 不 会 使 映射 区 的 内 容 写 到 磁盘 
文件 上 。 对 于 MAP. SHARED 区 磁盘 文件 的 更 新 ， 会 在 我 们 将 数据 写 到 存储 映射 区 后 的 某 个 时 刻 ， 
按 内 核 虚拟 存储 算法 自动 进行 。 在 存储 区 解除 映射 后 , 对 MAP_PRIVATE 存储 区 的 修改 会 被 丢弃 。 


a XA 
14-27 中 的 程序 用 存储 映射 VO 复制 文件 〈 类 似 于 cp(1) 命 令 )。 528 


#include "apue.h" 
#include «fcntl.h» 
#include <sys/mman.h> 
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#define COPYINCR (1024*1024*1024) /* 1 GB */ 


int 
main(int argc, char *argv[]) 


{ 


int fdin, fdout; 
void *src, *dst; 
size_t copysz; 
struct stat  sbuf; 

off t fsz = 0; 


if (argc != 3) 
err quit("usage: $s «fromfile» «tofile»", argv[0]); 


if ((fdin = open(argv[1], O RDONLY)) < O0) 
err sys("can't open $s for reading", argv[1]); 


if ((fdout = open(argv[2], O RDWR | O CREAT | O TRUNC, 
FILE MODE)) < 0) 
err sys("can't creat $s for writing", argv[2]); 


if (fstat(fdin, &sbuf) < 0) /* need size of input file */ 
err sys("fstat error"); 


if (ftruncate(fdout, sbuf.st size) « 0) /* set output file size */ 
err sys("ftruncate error"); 


while (fsz < sbuf.st size) { 
if ((sbuf.st size - fsz) » COPYINCR) 
copysz = COPYINCR; 
else 
copysz = sbuf.st_size - fsz; 


if ((src = mmap(0, copysz, PROT READ, MAP SHARED, 
fdin, fsz)) -- MAP FAILED) 
err sys("mmap error for input"); 
if ((dst = mmap(0, copysz, PROT READ | PROT WRITE, 
MAP SHARED, fdout, fsz)) -- MAP FAILED) 
err sys("mmap error for output"); 


memcpy(dst, src, copysz); /* does the file copy */ 
munmap(src, copysz); 
munmap (dst, copysz); 
fsz += copysz; 
} 
exit (0); 


14-7 用 存储 映射 VO 复制 文件 


该 程序 首先 打开 两 个 文件 ， 然 后 调用 fstat 得 到 输入 文件 的 长 度 。 在 为 输入 文件 调用 mmap 
和 设置 输出 文件 长 度 时 都 需 使 用 输入 文件 长 度 。 可 以 调用 ftruncate 设置 输出 文件 的 长 度 。 如 
果 不 设置 输出 文件 的 长 度 ， 则 对 输出 文件 调用 mmap 也 可 以 ， 但 是 对 相关 存储 区 的 第 一 次 引用 会 
产生 SIGBUS 信和 号 。 
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然后 对 每 个 文件 调用 mmap， 将 文件 映射 到 内 存 ， 最 后 调用 memcpy 将 输入 缓冲 区 的 内 容 复 
制 到 输出 缓冲 区 。 为 了 限制 使 用 内 存 的 量 ， 我 们 每 次 最 多 复制 1 GB 的 数据 〈 如 果 系 统 没有 足够 
的 内 存 ， 可 能 无 法 把 一 个 很 大 的 文件 中 的 所 有 内 容 都 映射 到 内 存 中 )。 在 映射 文件 中 的 后 一 部 分 

数据 之 前 ， 我 们 需要 解除 前 一 部 分 数据 的 映射 。 
在 从 输入 缓冲 区 (src) 取 数据 字 节 时 , 内 核 自 动 读 输入 文件 ; 在 将 数据 存 入 输出 缓冲 区 (dst) 

时 ， 内 核 自动 将 数据 写 到 输出 文件 中 。 

数据 被 写 到 文件 的 确切 时 间 依 赖 于 系统 的 页 管理 算法 。 某 些 系 统 设 置 了 守护 进程 ， 在 系统 运 
行 期 间 ， 它 慢 条 斯 理 地 将 改写 过 的 页 写 到 磁盘 上 。 如 果 想 要 确保 数据 安全 地 写 到 文件 中 ， 则 需 在 

进程 终止 前 以 MS_SYNC 标志 调用 msync。 


将 存储 区 映射 复制 与 用 read 和 write 进行 的 复制 (缓冲 区 长 度 为 8192) 相 比 较 ， 得 到 
图 14-28 中 所 示 的 结果 。 其 中 ， 时 间 单 位 是 秒 ， 被 复制 文件 的 长 度 是 300MB。 注意 ,我 们 并 没有 
在 退出 前 将 数据 同步 到 磁盘 。 


Linux 3.2.0 (Intel x86) Solaris 10 (SPARC) 
" à T ; 
‘waite | 0.01 0.54 5.67 0.29 10.60 43.67 
mmap/memcpy 0.08 0.65 22.54 1.89 8.56 38.42 


图 14-28 read/write 与 mmap/memcpy 比较 的 时 间 结 果 

在 Linux 3.2.0 和 Solaris 10 中 ， 两 种 方法 的 总 的 CPU 时 间 (用 户 时 间 + 系 统 时 间 〉 几乎 是 相 
同 的 。 在 Solaris 中 ， 使 用 mmap 和 memcpy 复制 ， 与 使 用 read 和 write 相 比 ， 花 费 了 更 多 的 
用 户 时 间 ， 但 却 减少 了 系统 时 间 。 在 Linux 中 ， 用 户 时 间 的 结果 很 相似 ， 但 是 用 read 和 write 
消耗 的 系统 时 间 要 比 使 用 mmap 和 memcpy 略 好 一 些 。 这 两 种 版 本 的 方法 是 殊途同归 的 。 

二 者 的 主要 区 别 在 于 ， 与 mmap 和 memcpy 相 比 ，read 和 write 执行 了 更 多 的 系统 调用 ， 并 
做 了 更 多 的 复制 。read 和 write 将 数据 从 内 核 缓 冲 区 中 复制 到 应 用 缓冲 区 (read)， 然 后 再 把 数 
据 从 应 用 缓冲 区 复制 到 内 核 缓冲 区 (write)。 而 mmap 和 memcpy 则 直接 把 数据 从 映射 到 地 址 空 
间 的 一 个 内 核 缓冲 区 复制 到 男 一 个 内 核 缓冲 区 。 当 引用 尚 不 存在 的 内 存 页 时 ,这 样 的 复制 过 程 就 会 作 
为 处 理 页 错误 的 结果 而 出 现 〈 每 次 错 页 读 发 生 一 次 错误 ， 每 次 错 页 写 发 生 一 次 错误 )。 如 果 系 统 调 用 
和 额外 的 复制 操作 的 开销 和 页 错误 的 开销 不 同 ， 那 么 这 两 种 方法 中 就 会 有 一 种 比 另 一 种 表现 更 好 。 

在 Linux 3.2.0 中 ， 相 对 于 运行 时 间 ， 两 种 版 本 的 程序 在 时 钟 时 间 上 显示 出 了 巨大 的 差异 : 使 
用 read 和 write 的 版 本 完成 任务 比 使 用 mmap 和 memcpy 的 版 本 快 了 4 倍 。 然 而 在 Solaris 10 
中 ， 使 用 mmap 和 memcpy 的 版 本 比 使 用 read 和 write 的 版 本 要 快 。 既 然 二 者 的 CPU 时 间 几 
乎 是 相同 的 ， 为 何 它们 的 时 钟 时 间 差 异 却 如 此 之 大 呢 ? 一 种 可 能 是 ， 在 一 种 版 本 中 需要 较 长 的 时 
间 来 等 待 IO 完成 。 这 个 等 待 时 间 并 没有 计算 在 CPU 的 处 理 时 间 中 。 另 一 种 可 能 是 ， 某 些 系统 
处 理 的 时 间 可 能 并 没有 在 程序 中 计算 ， 比 如 系统 守护 进程 把 页 写 到 磁盘 中 的 操作 。 由 于 需要 为 
读 和 写 分 配 页 ， 系 统 的 守护 进程 会 帮助 我 们 准备 可 用 的 页 。 如 果 页 的 写 操 作 是 随机 的 而 非 连 续 
的 ， 那 么 把 它们 写 入 磁盘 所 需要 的 时 间 会 更 长 ， 因 此 在 页 可 以 被 用 来 复 用 之 前 所 需 等 待 的 时 间 也 
会 更 长 。 5 

有 的 系统 将 一 个 普通 文件 复制 到 另 一 个 普通 文件 中 时 ， 存 储 映 射 IO 可 能 会 比较 快 。 但 是 有 一 
些 限制 ， 例 如 ， 不 能 用 这 种 技术 在 某 些 设备 之 间 〈 如 网 络 设备 或 终端 设备 ) 进行 复制 ， 并 且 在 对 被 
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复制 的 文件 进行 映射 后 ， 也 要 注意 该 文件 的 长 度 是 否 改变 。 尽 管 如 此 ， 某 些 应 用 程序 仍然 能 得 益 于 
存储 映射 TO， 因为 它 处 理 的 是 存储 空间 而 不 是 读 、 写 一 个 文件 ， 所 以 常常 可 以 简化 算法 。 从 存储 
映射 IO 中 得 益 的 一 个 例子 是 对 帧 缓冲 设备 的 操作 ， 该 设备 引用 位 图 式 显 示 Cbit-mapped display). 
Krieger. Stumm 和 Unrau[1992] 描 述 了 一 个 使 用 存储 映射 IO 的 标准 UO 库 ( 见 第 5 章 )。 
15.9 节 还 会 提 到 存储 映射 VO, 其 中 还 举 了 一 个 例子 , 说 明 如 何 使 用 存储 映射 IO 在 两 个 相关 
进程 间 提 供 共 享 存储 区 。 


14.9 小 结 


本 章 描述 了 很 多 高 级 IO 功能 ， 其 中 有 许多 将 用 在 后 面 章节 的 实例 中 。 

。 非 阻塞 IO 一 一 发 一 个 VO 操作 ， 不 使 其 阻塞 。 

。 记录 锁 (在 第 20 章 中 有 一 个 实例 ， 该 实例 会 对 此 进行 更 详细 的 讨论 )。 

e VO 多 路 转 接 一 一 select fl poll 函数 〈 在 后 面 的 很 多 实例 中 会 用 到 这 两 个 函数 )。 
。 readv 和 writev 函数 (在 后 面 的 很 多 实例 中 也 会 用 到 这 两 个 函数 )。 

e 存储 映射 IO (mmap)。 


习题 


14.1 编写 一 个 测试 程序 说 明 你 所 用 系统 在 下 列 情况 下 的 运行 情况 : 一 个 进程 在 试图 对 一 个 文件 
的 某 个 范围 加 写 锁 的 时 候 阻 塞 ， 之 后 其 他 进程 又 提出 了 一 些 相关 的 加 读 锁 请 求 。 试 图 加 写 
锁 的 进程 会 不 会 因此 而 饿 死 ? 

14.2 查看 你 所 用 系统 的 头 文件 ， 并 研究 select 和 4 个 FD_ 宏 的 实现 。 

14.3 系统 头 文件 通常 对 fd set 数据 类 型 可 以 处 理 的 最 大 描述 符 数 有 一 个 内 置 的 限制 ， 假 设 需 
要 将 描述 符 数 增加 到 2048， 该 如 何 实现 ? 

14.4 比较 处 理 信 号 量 集 的 函数 ( 见 10.11 节 ) 和 处 理 £a set 描述 符 集 的 函数 ， 并 比较 这 两 类 函 
数 在 你 系统 上 的 实现 。 

14.5 用 select EK poll 实现 一 个 与 sleep 类似 的 函数 sleep_us， 不 同 之 处 是 要 等 待 指定 的 
若干 微 秒 。 比 较 这 个 函数 和 BSD 中 的 usleep 函数 。 

14.6 是 否 可 以 利用 建议 性 记录 锁 来 实现 图 10-24 中 的 函数 TELL WAIT. TELL PARENT. 
TELL CHILD. WAIT PARENT 以 及 WAIT_CHILD? WRT U, 编写 这 些 函 数 并 测试 其 功能 。 

14.7 用 非 阻塞 写 来 确定 管道 的 容量 。 将 其 值 与 第 2 BAH PIPE_BUF 值 进行 比较 。 

14.8 重 写 图 14-21 中 的 程序 来 制作 一 个 过 滤器 : 从 标准 输入 中 读 入 并 向 标准 输出 写 , 但 是 要 使 用 
异步 VO 接口 。 为 了 使 之 能 正常 工作 ， 你 都 需要 修改 些 什么 ? 记 住 ， 无 论 你 的 标准 输出 被 连 
接 到 终端 、 管 道 还 是 一 个 普通 文件 ， 都 应 该 得 到 相同 的 结果 。 

14.9 回忆 图 14-23， 在 你 的 系统 上 找到 一 个 损益 平衡 点 ， 从 此 点 开始 ， 使 用 writev 将 快 于 你 自 
己 使 用 单个 write 复制 数据 。 

14.10 运行 图 14-27 中 的 程序 复制 一 个 文件 ， 检 查 输 入 文件 的 上 一 次 访问 时 间 是 否 更 新 了 ? 

14.11 在 图 14-27 的 程序 中 , 在 调用 mmap 后 调用 close 关闭 输入 文件 ， 以 验证 关闭 描述 符 不 会 

使 内 存 映射 IO 失效 。 
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15.1 引言 


第 8 章 说 明了 进程 控制 原 语 ， 并 且 观 察 了 如 何 调用 多 个 进程 。 但 是 这 些 进程 之 间 交 换 信息 的 
唯一 途径 就 是 传送 打开 的 文件 ， 可 以 经 由 fork 或 exec 来 传送 ， 也 可 以 通过 文件 系统 来 传送 。 
本 章 将 说 明 进 程 之 间 相 互通 信 的 其 他 技术 一 一 进程 间 通 信 (InterProcess Communication, IPC). 

过 去 ，UNIX 系统 IPC 是 各 种 进程 通信 方式 的 统称 ， 但 是 ， 这 些 通信 方式 中 极 少 有 能 在 所 有 
UNIX 系统 实现 中 进行 移植 的 。 随 着 POSIX 和 The Open Group (VAG X/Open) 标准 化 的 推进 
和 影响 的 扩大 ,情况 已 得 到 改善 , 但 差别 仍然 存在 。 图 15-1 摘要 列 出 了 本 书 讨论 的 4 种 实现 所 支 
持 的 不 同形 式 的 IPC. 


全 双 工 管道 
命名 全 双 工 管道 
XSI 消 ae 


XSI 信号 量 
XSI 共享 存储 








消息 队列 “实时 ) 
信号 量 
共享 存储 (实时) 


[eme [em] | | 7 1 | 
STREAMS 废弃 的 
图 15-1 UNIX 系统 IPC 摘要 

注意 ， 虽 然 Single UNIX Specification (“SUS” 列 ) 要 求 的 是 半 双 工 管道 , 但 允许 实现 支持 全 
双 工 管道 。 即 使 应 用 程序 在 编写 时 假定 基础 操作 系统 只 支持 半 双 工 管道 ， 支 持 全 双 工 管道 的 实现 
也 能 用 这 种 应 用 程序 正常 工作 。 图 中 使 用 “(全 )” 表 示 用 全 双 工 管道 支持 半 双 工 管道 的 实现 。 

在 图 15-1 中 ,我 们 在 支持 基本 功能 的 位 置 处 标注 了 一 个 黑 点 。 对 于 全 双 工 管道 ， 如 果 该 特征 
是 经 由 UNIX ERF (UNIX domain socket， 见 17.2 节 ) 支持 的 ， 则 在 相应 列 中 标注 “UDS”。 
某 些 实现 用 管道 和 UNIX 域 套 接 字 来 支持 该 特征 ， 所 以 这 些 位 置 上 标 有 “*。、UDS”。 

IPC 接口 作为 POSIX.1 实时 扩展 的 一 部 分 ， 也 是 Single UNIX Specification 中 的 选项 。 在 SUSv4 
中 ， 信 号 量 接口 从 可 选 规范 移 到 了 基本 规范 中 。 

虽然 命名 全 双 工 管道 作为 被 挂 载 的 基于 STREAMS 的 管道 使 用 ， 但 是 Single UNIX Specification 
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将 它 标 记 成 弃 用 的 。 


尽管 Linux 中 OpenSS7 项 目的 “Linux Fast-STREAMS” 包 支持 STREAMS, 但 是 这 个 包 最 近 
都 没有 更 新 。 从 2008 年 以 来 最 新 的 包 版 本 只 到 内 核 版 本 2.6.26。 


图 15-1 中 前 10 种 IPC 形式 通常 限于 同一 台 主 机 的 两 个 进程 之 间 的 IPC。 最 后 两 行 〈 套 接 字 
和 STREAMS) 是 仅 有 的 支持 不 同 主机 上 两 个 进程 之 间 IPC 的 两 种 形式 。 

我 们 将 与 IPC 有 关 的 讨论 分 成 3 章 。 本 章 讨论 经 典 的 IPC: 管道 、FIFO、 消 息 队 列 、 信 号 量 
以 及 共享 存储 。 下 一 章 讨论 使 用 套 接 字 机 制 的 网 络 IPC。 第 17 章 说 明 IPC 的 某 些 高 级 特征 。 


15.2 管道 


管道 是 UNIX 系统 IPC 的 最 古老 形式 ， 所 有 UNIX 系统 都 提供 此 种 通信 机 制 。 管 道 有 以 下 两 
种 局 限 性 。 

(D 历史 上 ， 它 们 是 半 双 工 的 〈 即 数据 只 能 在 一 个 方向 上 流动 )。 现 在 ， 某 些 系统 提供 全 双 
工 管道 ， 但 是 为 了 最 佳 的 可 移植 性 ， 我 们 决 不 应 预先 假定 系统 支持 全 双 工 管道 。 

(2) 管道 只 能 在 具有 公共 祖先 的 两 个 进程 之 间 使 用 。 通 常 ， 一 个 管道 由 一 个 进程 创建 ， 在 进 
程 调用 fork 之 后 ， 这 个 管道 就 能 在 父 进程 和 子 进程 之 间 使 用 了 。 

我 们 将 会 看 到 FIFO Chl 15.5 节 ) 没有 第 二 种 局 限 性 ，UNIX 域 套 接 字 ( 见 172 节 ) 没有 这 
两 种 局 限 性 。 

尽管 有 这 两 种 局 限 性 ， 半 双 工 管道 仍 是 最 常用 的 IPC 形式 。 每 当 在 管道 中 键入 一 个 命令 序列 ， 
让 shell 执行 时 ，shell 都 会 为 每 一 条 命令 单独 创建 一 个 进程 ， 然 后 用 管道 将 前 一 条 命令 进程 的 标 
准 输出 与 后 一 条 命令 的 标准 输入 相连 接 。 

管道 是 通过 调用 pipe 函数 创建 的 。 


#include <unistd.h> 





int pipe(int fdl2]); 


返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 


经 由 参数 应 返回 两 个 文件 描述 符 : fal0] 为 读 而 打开 ，fd[1] 为 写 而 打开 。f4U[1] 的 输出 是 fano] 
的 输入 。 





最 初 在 4.3BSD 和 4.4BSD 中 ,管道 是 用 UNIX 域 套 接 字 实现 的 。 虽 然 UNIX 域 套 接 字 默认 是 
全 双 工 的 ， 但 这 些 操作 系统 阻碍 了 用 于 管道 的 套 接 字 ， 以 至 于 这 些 管道 只 能 以 半 双 工 模式 操作 。 
POSIX.1 允许 实现 支持 全 双 工 管道 。 对 于 这 些 实现 ，fU[0] 和 fd[1] 以 读 / 写 方式 打开 。 


图 15-2 中 给 出 了 两 种 描绘 半 双 工 管道 的 方法 。 左 图 显示 管道 的 两 端 在 一 个 进程 中 相互 连接 ， 
右 图 则 强调 数据 需要 通过 内 核 在 管道 中 流动 。 
fstat 函数 ( 见 4.2 节 ) 对 管道 的 每 一 端 都 返回 一 个 FIFO 类 型 的 文件 描述 符 。 可 以 用 S_ISFIFO 
宏 来 测试 管道 。 
POSIX.1 规定 stat 结构 的 st size 成 员 对 于 管道 是 未 定义 的 。 但 是 当 fstat 函数 应 用 于 
管道 读 端 的 文件 描述 符 时 , 很 多 系统 在 st_size 中 存储 管道 中 可 用 于 读 的 字 节 数 。 但 是 , 这 是 不 
可 移植 的 。 
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用 户 进 程 用 户 进程 


或 者 
fd[0]  fd[1] fd[0] fd[1] 











15-2 ”描绘 半 双 工 管道 的 两 种 方法 


单个 进程 中 的 管道 几乎 没有 任何 用 处 。 通 常 ， 进 程 会 先 调用 pipe， 接 着 调用 fork, ATE 
建 从 父 进程 到 子 进程 的 IPC 通道 ， 反 之 亦 然 。 图 15-3 显示 了 这 种 情况 。 535 


父 进程 子 进程 
fd[0]  fd[1] fd[0]  fd[1] 








内 核 
图 15-3 fork 之 后 的 半 双 工 管道 


fork 之 后 做 什么 取决 于 我 们 想 要 的 数据 流 的 方向 。 对 于 从 父 进 程 到 子 进程 的 管道 ， 父 进程 关 
闭 管道 的 读 端 (fd[0] )， 子 进程 关闭 写 端 (fd[1] )。 图 15-4 显示 了 在 此 之 后 描述 符 的 状态 结果 。 


子 进程 
a 








内 核 


图 15-4 ”从 父 进程 到 子 进 程 的 管道 
对 于 一 个 从 子 进程 到 父 进 程 的 管道 ， 父 进程 关闭 fd[11， 子 进程 关闭 fd[0]。 
当 管 道 的 一 端 被 关闭 后 ， 下 列 两 条 规则 起 作用 。 
(OD 当 读 (read) 一 个 写 端 已 被 关闭 的 管道 时 ， 在 所 有 数据 都 被 读 取 后 ，read 返回 0， 表 
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示 文 件 结束 。( 从 技术 上 来 讲 ， 如 果 管 道 的 写 端 还 有 进程 ， 就 不 会 产生 文件 的 结束 。 可 以 复制 一 
个 管道 的 描述 符 ， 使 得 有 多 个 进程 对 它 具 有 写 打 开 文 件 描述 符 。 但 是 ， 通 常 一 个 管道 只 有 一 个 读 
进程 和 一 个 写 进 程 。 下 一 节 介 绍 FIFO 时 ， 会 看 到 对 于 单个 的 FIFO 常常 有 多 个 写 进程 。) 

(2) WRS (rite) 一 个 读 端 已 被 关闭 的 管道 ， 则 产生 信号 SIGPIPE。 如 果 和 忽略 该 信号 或 
者 捕捉 该 信号 并 从 其 处 理 程序 返回 ， 则 write 返回 一 1，errno 设置 为 EPIPE。 

在 写 管道 (或 FIFO) 时 ， 常 量 PIPE BUF 规定 了 内 核 的 管道 缓冲 区 大 小 。 如 果 对 管道 调用 
write， 而 且 要 求 写 的 字 节 数 小 于 等 于 PIPE_BUF， 则 此 操作 不 会 与 其 他 进程 对 同一 管道 (或 
FIFO) 的 write 操作 交叉 进行 。 但 是 ， 若 有 多 个 进程 同时 写 一 个 管道 (或 FIFO)， 而 且 我 们 要 
求 写 的 字 节 数 超过 PIPE_BUE， 那 么 我 们 所 写 的 数据 可 能 会 与 其 他 进程 所 写 的 数据 相互 交叉 。 用 
pathconf 或 fpathconf 函数 〈 见 图 2-12) 可 以 确定 PIPE BUF 的 值 。 


图 15-5 程序 创建 了 一 个 从 父 进程 到 子 进 程 的 管道 ， 并 且 父 进程 经 由 该 管道 向 子 进程 传送 数据 。 


#include "apue.h" 





int 
main (void) 
{ 


int n; 


int fd [2]? 
pid_t pid; 
char line [MAXLINE]; 


if (pipe(fd) < 0) 
err_sys("pipe error"); 

if ((pid = fork()) < 0) { 
err_sys("fork error"); 


} else if (pid > 0) { /* parent */ 
close (fd[0]); 
write(fd[1], “hello world\n", 12); 

} else { /* child */ 
close (fd[1]); 


n  read(fd[0], line, MAXLINE); 
write(STDOUT FILENO, line, n); 
] 
exit(0); 





15-5. 经 由 管道 从 父 进程 向 子 进 程 传送 数据 
注意 ， 这 里 的 管道 方向 和 图 15-4 中 的 是 一 致 的 。 = 
在 上 面 的 例子 中 ， 直 接 对 管道 描述 符 调用 了 read 和 write。 更 有 趣 的 是 将 管道 描述 符 复制 
到 了 标准 输入 或 标准 输出 上 。 通 常 ， 子 进程 会 在 此 之 后 执行 男 一 个 程序 ， 该 程序 或 者 从 标准 输入 
(已 创建 的 管道 ) 读数 据 ， 或 者 将 数据 写 至 其 标准 输出 (该 管道 )。 


m SP 


试 着 编写 一 个 程序 ， 其 功能 是 每 次 一 页 地 显示 已 产生 的 输出 。 已 经 有 很 多 UNIX 系统 公用 程 
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序 具 有 分 页 功能 ， 因 此 无 需 再 构造 一 个 新 的 分 页 程序 ， 只 要 调用 用 户 最 喜爱 的 分 页 程序 就 可 以 了 。 
为 了 避免 先 将 所 有 数据 写 到 一 个 临时 文件 中 ， 然 后 再 调用 系统 中 有 关 程 序 显示 该 文件 ， 我 们 希望 
通过 管道 将 输出 直接 送 到 分 页 程序 。 为 此 ， 先 创建 一 个 管道 ，fork 一 个 子 进程 ， 使 子 进程 的 标 
准 输入 成 为 管道 的 读 端 ， 然 后 调用 exec， 执 行 用 的 分 页 程序 。 图 15-6 中 的 程序 显示 了 如 何 实现 
这 些 操作 。( 本 例 要 求 在 命令 行 中 有 一 个 参数 指定 要 显示 的 文件 的 名 称 。 通 常 ， 这 种 类 型 的 程序 
要 求 在 终端 上 显示 的 数据 已 经 在 存储 器 中 了 。) 


#include "apue.h" 
#include <sys/wait.h> 


#define DEF_PAGER "/bin/more" /* default pager program */ 
int 


main(int argc, char *argv[]) 


{ 


int n; 

int £d[2]; 

pid t pid; 

char *pager, *argv0; 
char line[MAXLINE]; 
FILE *fp; 


if (argc != 2) 
err quit("usage: a.out <pathname>") ; 


if ((fp = fopen(argv[1], "r")) == NULL) 
err sys("can't open $s", argv[1]); 
if (pipe(fd) < 0) 
err sys("pipe error"); 


if ((pid = fork()) < 0) ( 
err sys("fork error"); 

) else if (pid » O) ( /* parent */ 
close (fd[0]); /* close read end */ 


/* parent copies argv[1] to pipe */ 


while (fgets(line, MAXLINE, fp) !- NULL) { 
n = strlen(line); 
if (write(fd[1], line, n) f= n) 


err sys("write error to pipe"); 
) 
if (ferror(fp)) 
err sys("fgets error"); 


close (fd[1]); /* close write end of pipe for reader */ 


if (waitpid(pid, NULL, 0) < 0) 


err sys("waitpid error"); 
exit (0); 
) else ( /® child. */ 
close (fd[1]); /* close write end */ 
if (fd[0] != STDIN_FILENO) { 


if (dup2(fd[0], STDIN_FILENO) != STDIN_FILENO) 
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err sys("dup2 error to stdin"); 
close(fd[0]); /* don't need this after dup2 */ 
} 


/* get arguments for execl() */ 
if ((pager = getenv("PAGER")) == NULL) 
pager = DEF_PAGER; 
if ((argvO = strrchr (pager, '/')) != NULL) 
argvO++; /* step past rightmost slash */ 
else 
argvO = pager; /* no slash in pager */ 


if (execl (pager, argvO, (char *)0) < 0) 
err_sys("execl error for %s", pager); 


} 
exit (0); 


15-6 将 文件 复制 到 分 页 程序 


在 调用 fork 之 前 ， 先 创建 一 个 管道 。 调 用 fork 之 后 ， 父 进程 关闭 其 读 端 ， 子 进程 关闭 其 
写 端 。 然 后 子 进程 调用 dup2， 使 其 标准 输入 成 为 管道 的 读 端 。 当 执行 分 页 程序 时 ， 其 标准 输入 
将 是 管道 的 读 端 。 

将 一 个 描述 符 复制 到 另 一 个 上 在 子 进程 中 ，fd[0] 复 制 到 标准 输入 )， 在 复制 之 前 应 当 比 
较 该 描述 符 的 值 是 否 已 经 具有 所 希望 的 值 。 如果 该 描述 符 已 经 具有 所 希望 的 值 , 并 且 调 用 了 dup2 
和 close， 那 么 该 描述 符 的 副本 将 关闭 。( 回 忆 3.12 节 中 所 述 ， 当 dup2 中 的 两 个 参数 值 相等 时 
的 操作 。) 在 本 程序 中 ， 如 果 shell 没有 打开 标准 输入 ,那么 程序 开始 处 的 fopen 应 已 使 用 描述 符 
0, 也 就 是 最 小 未 使 用 的 描述 符 , 所 以 £a [0] 决 不 会 等 于 标准 输入 。 尽 管 如 此 , 无 论 何 时 调用 dup2 
和 close 将 一 个 描述 符 复制 到 另 一 个 上 ， 作 为 一 种 保护 性 的 编程 措施 ， 都 要 先 将 两 个 描述 符 进 


行 比较 。 

请 注意 ， 我 们 是 如 何尝 试 使 用 环境 变量 PAGER 获得 用 户 分 页 程序 名 称 的 。 如 果 这 种 操作 没 
有 成 功 ， 则 使 用 系统 默认 值 。 这 是 环境 变量 的 常见 用 法 。 "8 
"a Scl 


回忆 8.9 节 中 的 5 个 函数 : TELL WAIT. TELL PARENT. TELL CHILD. WAIT PARENT 和 
WAIT CHILD. [E 10-24 中 提供 了 一 个 使 用 信号 的 实现 。 图 15-7 则 提供 了 一 个 使 用 管道 的 实现 。 


#include "apue.h" 
static int pfd1[2], pfd2[2]; 


void 
TELL WAIT (void) 
{ 
if (pipe(pfdl) < 0 || pipe(pfd2) < 0) 
err_sys("pipe error"); 
} 


void 
TELL PARENT (pid t pid) 
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if (write(pfd2[1], "c", 1) != 1) 
err_sys("write error"); 
} 


void 
WAIT_PARENT (void) 
{ 


char c; 


if (read(pfd1[0], &c, 1) != 1) 
err_sys ("read error"); 


if (e 1= “pty 
err quit("WAIT PARENT: incorrect data"); 
) 


void 
TELL CHILD(pid t pid) 
{ 
if (write(pfd1[1], "p", 1) != 1) 
err sys("write error"); 


} 


void 
WAIT_CHILD (void) 
{ 


char c; 


if (read(pfd2[0], &c, 1) != 1) 
err sys ("read error"); 


if (c t= 'c') 
err quit("WAIT CHILD: incorrect data"); 


图 15-7 让 父 进 程 和 子 进程 同步 的 例 程 
如 图 15-8 中 所 示 ， 我 们 在 调用 fork 之 前 创建 了 两 个 管道 。 父 进程 在 调用 TELL CHILD 
时 ， 经 由 上 一 个 管道 写 一 个 字符 “p”， 子 进程 在 调用 TELL_PARENT 时 ， 经 由 下 一 个 管道 写 
一 个 字符 “c”。 相 应 的 wAIT XXX 函数 调用 read 读 一 个 字符 ， 没 有 读 到 字符 时 则 阻塞 〈 休 
眠 等 待 )。 


pfdi[1] 


pfd2[0] 





图 15-8 用 两 个 管道 实现 父 进程 和 子 进程 同步 
注意 , 每 一 个 管道 都 有 一 个 额外 的 读 取 进程 , 这 没有 关系 。 也 就 是 说 , 除了 子 进 程 从 pfdl [01] 
读 取 ， 父 进程 也 有 上 一 个 管道 的 读 端 。 因 为 父 进程 并 没有 执行 对 该 管道 的 读 操作 ， 所 以 这 不 会 
影响 我 们 。 " 
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15.3 AŽ popen 和 pclose 


常见 的 操作 是 创建 一 个 连接 到 另 一 个 进程 的 管道 ， 然 后 读 其 输出 或 向 其 输入 端 发 送 数据 ， 为 
此 ， 标 准 VO 库 提 供 了 两 个 函数 popen 和 pclose。 这 两 个 函数 实现 的 操作 是 : 创建 一 个 管道 ， 
fork 一 个 子 进程 ， 关 闭 未 使 用 的 管道 端 ， 执 行 一 个 shell 运行 命令 ， 然 后 等 待命 令 终止 。 


#include <stdio.h> 





FILE *popen(const char *cmdstring, const char *type); 
返回 值 : 车 成 功 ， 返 回 文件 指针 ; 若 出 错 ， 返 回 NULL 


int pclose(FILE *fp); 





返回 值 : 若 成 功 ， 返 回 cmdstring 的 终止 状态 ， 若 出 错 ， 返 回 -1 


函数 popen 先 执行 fork, 然后 调用 exec 执行 cmdstring, 并 且 返 回 一 个 标准 VO 文件 指针 。 
如 果 type 是 "r"， 则 文件 指针 连接 到 cmdstring 的 标准 输出 〈 见 图 15-9). 
如 果 type 是 "w"， 则 文件 指针 连接 到 emdstring 的 标准 输入 ， 如 图 15-10 所 示 。 





父 进程 cmdstring ( 子 进程 ) 父 进程 cmdstring ( 子 进程 ) 
图 15-9 执行 fp = popen 15-10 执行 fp = popen 
(cmdstring，"r") 的 结果 (emdstring, "w") 的 结果 


有 一 种 方法 可 以 帮助 我 们 记 住 popen 的 最 后 一 个 参数 及 其 作用 ， 这 就 是 与 fopen 进行 类 比 。 
如 果 type 是 "r"， 则 返回 的 文件 指针 是 可 读 的 ， 如 果 type 是 "ww"， 则 是 可 写 的 。 

pclose 函数 关闭 标准 IO 流 ， 等 待命 令 终止 ， 然 后 返回 shell 的 终止 状态 。( 我 们 曾 在 8.6 节 
中 描述 过 终止 状态 ，8.13 节 描 述 的 system 函数 也 返回 终止 状态 。) 如果 shell 不 能 被 执行 ， 则 
pclose 返回 的 终止 状态 与 shell 已 执行 exit (127) 一 样 。 

cmdstring 由 Bourne shell 以 下 列 方式 执行 : 


sh -c cmdstring 


这 表示 shell 将 扩展 cmdstring 中 的 任何 特殊 字符 。 例 如 ， 可 以 使 用 : 


fp = popen("Is *.c" , "r")i 
或 者 

fp = popen("cmd 2>&1" , "r"); 
^w Scl 


用 popen 重 写 图 15-6 中 的 程序 ， 其 结果 如 图 15-11 Aras. 


#include "apue.h" 
#include <sys/wait.h> 


#define PAGER "S(PAGER:-more)" /* environment variable, or default */ 


int 
main(int argc, char *argv[]) 





char line[MAXLINE]; 
FILE *fpin, *fpout; 


if (arge != 2) 
err quit("usage: a.out <pathname>") ; 
if ((fpin = fopen(argv[1], "r")) == NULL) 
err sys("can't open %s", argv[1]); 


if ((fpout = popen(PAGER, "w")) == NULL) 
err sys("popen error"); 


/* copy argv[1] to pager */ 
while (fgets(line, MAXLINE, fpin) !- NULL) 
if (fputs(line, fpout) == EOF) 
err sys("fputs error to pipe"); 
) 
if (ferror(fpin)) 
err sys("fgets error"); 
if (pclose(fpout) == -1) 
err sys("pclose error"); 


exit(0); 


使 用 popen 减少 了 需要 编写 的 代码 量 。 
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图 15-11 Hi popen 向 分 页 程序 传送 文件 


shell 命令 ${PRAGER: -more} 的 意思 是 : 如 果 shell 变量 PAGER 已 经 定义 ， 且 其 值 非 空 ， 则 使 
用 其 值 ， 否 则 使 用 字符 串 more. a 


“gl: 函数 Popen 和 pclose 


15-12 中 的 程序 是 我 们 编写 的 popen fil pclose. 


#include "apue.h" 
#include <errno.h> 
#include «fcntl.h» 
#include <sys/wait.h> 


/* 


* Pointer to array allocated at run-time. 


my), 


static pid t *childpid = NULL; 


/* 

* From our open_max(), {Figure 2.17}. 
sd 

static int maxfd; 

FILE * 


popen(const char *cmdstring, const char *type) 


{ 


int i; 
int pfd[2]; 
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pid_t pid; 
FILE *Eps 


/* only allow "r" or "w" */ 

if ((type[0] != 'r' && type[0] != 'w') || type[1] != 0) { 
errno = EINVAL; 
return (NULL) ; 


if (childpid == NULL) { /* first time through */ 
/* allocate zeroed out array for child pids */ 
maxfd = open_max(); 
if ((childpid = calloc(maxfd, sizeof(pid_t))) == NULL) 
return (NULL); 


if (pipe(pfd) < 0) 
return (NULL); /* errno set by pipe() */ 
if (pfd[0] >= maxfd || pfd[1] >= maxfd) { 
close (pfd[0]); 
close (pfd[1]); 
errno - EMFILE; 
return (NULL); 


if ((pid = fork()) « 0) ( 
return(NULL); /* errno set by fork() */ 


) else if (pid == 0) ( /* child */ 
if (*type == PI) ff 
close (pfd[0]); 
if (pfd[1] != STDOUT FILENO) { 


dup2(pfd[1], STDOUT FILENO); 
close (pfd[1]); 

) 

} else { 

close(pfd[1]); 

if (pfd[0] != STDIN FILENO) { 
dup2(pfd[0], STDIN FILENO); 
close (pfd[0]); 


/* close all descriptors in childpid[] */ 
for (i = 0; i < maxfd; i++) 
if (childpid[i] » 0) 
close(i); 


execl("/bin/sh", "sh", "-c", cmdstring, (char *)0); 
_exit (127); 


/* parent continues... */ 
if (*type == 'r') { 
close (pfd[1]); 
if ((fp = fdopen(pfd[0], type)) == NULL) 
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return (NULL) ; 


} else { 
close (pfd[0]); 
if ((fp = fdopen(pfd[1], type)) == NULL) 
return (NULL); 
childpid[fileno(fp)] = pid; /* remember child pid for this fd */ 


return (fp); 


int 

pclose (FILE *fp) 

{ 
int fd, stat; 
pid_t pid; 


if (childpid == NULL) { 
errno = EINVAL; 
return (-1); /* popen() has never been called */ 


} 


fd = fileno(fp); 
if (fd >= maxfd) { 
errno = EINVAL; 


return (-1); /* invalid file descriptor */ 
} 
if ((pid = childpid[fd]) == 0) { 
errno = EINVAL; 
return (-1); /* fp wasn't opened by popen() */ 


} 


childpid[fd] = 0; 
if (fclose(fp) == EOF) 
return (-1); 


while (waitpid(pid, &stat, 0) < 0) 
if (errno != EINTR) 
return (-1); /* error other than EINTR from waitpid() */ 


return (stat); /* return child's termination status */ 


15-12 popen 函数 和 pclose 函数 
EUR popen 的 核心 部 分 与 本 章 中 前 面 用 过 的 代码 类 似 ， 但 是 增加 了 很 多 需要 考虑 的 细节 。 
首先 ， 每 次 调用 popen 时 ， 应 当 记 住所 创建 的 子 进程 的 进程 ID， 以 及 其 文件 描述 符 或 FILE 指 
针 。 我 们 选择 在 数组 childpid 中 保存 子 进程 ID, 并 用 文件 描述 符 作 为 其 下 标 。 于 是 , 当 以 FILE 
指针 作为 参数 调用 pclose 时 ， 调 用 标准 IO 函数 fileno 得 到 文件 描述 符 ， 然 后 取得 子 进程 ID， 
并 用 其 作为 参数 调用 waitpid。 因 为 一 个 进程 可 能 调用 Popen 多 次 ， 所 以 在 动态 分 配 childpid 
数组 时 【第 一 次 调用 popen 时 )， 其 数组 长 度 应 当 是 最 大 文件 描述 符 数 ， 于 是 该 数组 中 可 以 存放 
与 最 大 文件 描述 符 数 相同 的 子 进程 ID 数 。 
注意 ， 图 2-17 中 的 open_max 函数 可 以 返回 打开 文件 的 最 大 个 数 的 近似 值 ， 如 果 这 个 值 与 系 
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统 不 相关 的 话 。 注 意 不 要 使 用 那 种 其 值 大 于 (或 等 于 ) open_max 函数 返回 值 的 管道 文件 描述 符 。 
对 于 popen， 如 果 open max 函数 返回 的 值 恰 巧 非常 小 ， 那 我 们 会 关闭 管道 文件 描述 符 并 将 errno 
设置 为 EMFILE， 以 此 表明 这 里 的 很 多 文件 描述 符 是 打开 的 ， 最 后 返回 一 1。 对 于 pclose， 如 果 对 
应 于 文件 指针 参数 的 描述 符 比 所 期 望 的 大 ， 则 将 errno 设置 为 EINVAL， 并 返回 一 1。 

调用 pipe 和 fork， 然 后 为 popen 函数 中 的 每 个 进程 复制 合适 的 描述 符 ， 这 个 过 程 和 我 们 
在 本 章 前 面 所 做 的 相 类 似 。 

POSIX.1 要 求 popen 关闭 那些 以 前 调用 popen 打开 的 、 现 在 仍然 在 子 进程 中 打开 着 的 IO 
流 。 为 此 ， 在 子 进程 中 从 头 逐 个 检查 childpia 数组 的 各 个 元 素 ， 关 闭 仍 旧 打开 着 的 描述 符 。 

若 pclose 的 调用 者 已 经 为 信号 SIGCHLD 设置 了 一 个 信号 处 理 程序 , 则 pclose Pi) waitpid 
调用 将 返回 一 个 错误 EINTR。 因 为 允许 调用 者 捕捉 此 信号 (或 者 任何 其 他 可 能 中 断 waitpid 调用 的 
信号 )， 所 以 当 waitpid 被 一 个 捕捉 到 的 信号 中 断 时 ， 我 们 只 是 再 次 调用 waitpid. 

注意 ， 如 果 应 用 程序 调用 waitpid， 并 且 获 得 了 popen 创建 的 子 进程 的 退出 状态 ， 那 么 我 
们 会 在 应 用 程序 调用 pclose 时 调用 waitpid, 如 果 发 现 子 进程 已 不 再 存在 ,将 返回 -1, 将 errno 
设置 为 BCHILD。 这 正 是 这 种 情况 下 POSIX.1 所 要 求 的 。 


如 果 一 个 信号 中 断 了 wait, pclose 的 一 些 早 期 版 本 会 返回 错误 EINTR, pclose 的 一 些 早期 版 
AE wait 期间， 会 阻塞 或 忽略 信号 SIGINT, SIGQUIT 和 SIGHUP。 这 是 POSIX.1 所 不 允许 的 。 国 
注意 ，popen 决 不 应 由 设置 用 户 ID 或 设置 组 ID 程序 调用 。 当 它 执 行 命令 时 ，pPopen 等 同 于 : 
execl("/bin/sh", "sh", "-c", command, NULL); 
它 在 从 调用 者 继承 的 环境 中 执行 shell, JfHH shell 解释 执行 command。 一 个 恶意 用 户 可 以 操 
控 这 种 环境 , 使 得 shell 能 以 设置 ID 文件 模式 所 授予 的 提升 了 的 权限 以 及 非 预期 的 方式 执行 命令 。 
popen 特别 适用 于 执行 简单 的 过 滤器 程序 ， 它 变换 运行 命令 的 输入 或 输出 。 当 命令 希望 构造 
它 自 己 的 管道 时 ， 就 是 这 种 情形 。 


TES 

考虑 一 个 应 用 程序 ， 它 向 标准 输出 写 一 个 提示 ， 然 后 从 标准 输入 读 1 行 。 使 用 popen， 可 以 
在 应 用 程序 和 输入 之 间 搬 入 一 个 程序 以 便 对 输入 父 进程 过 滤器 程序 
进行 变换 处 理 。 图 15-13 显示 了 这 种 情况 下 的 进程 
安排 。 


对 输入 进行 的 变换 可 能 是 路 径 名 扩充 , 或 者 是 
提供 一 种 历史 机 制 ( 记 住 以 前 输入 的 命令 )。 

图 15-14 是 一 个 简单 的 用 于 演示 这 个 操作 的 过 
滤 程 序 。 它 将 标准 输入 复制 到 标准 输出 ， 在 复制 时 
将 大 写字 符 变换 为 小 写字 符 。 在 写 完 换行 符 之 后 ， 
要 仔细 冲洗 (用 fflush) 标准 输出 ， 这 样 做 的 理由 将 在 下 一 节 介绍 协同 进程 时 讨论 。 


#include "apue.h" 





15-13. FA popen 对 输入 进行 变换 处 理 


#include <ctype.h> 


int 
main (void) 


{ 
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int e; 
while ((c = getchar()) != EOF) { 
if (isupper(c) ) 
c = tolower(c); 
if (putchar(c) == EOF) 
err_sys ("output error"); 
if (c == '\n') 


fflush (stdout); 


} 
exit(0); 





图 15-14 ”将 大 写字 符 变 换 成 小 写字 符 的 过 滤 程 序 
将 这 个 过 滤 程 序 编译 成 可 执行 文件 myuclc， 然 后 图 15-15 的 程序 会 用 popen 调用 它 。 


#include "apue.h" 
#include <sys/wait.h> 


int 


main (void) 


{ 


char line [MAXLINE]; 
FILE *fpin; 
if ((fpin = popen("myuclc", "r")) == NULL) 

err sys("popen error"); 
tor (wo f 

fputs("prompt> ", stdout); 

fflush (stdout); 

if (fgets(line, MAXLINE, fpin) == NULL) /* read from pipe */ 

break; 
if (fputs(line, stdout) == EOF) 


err_sys("fputs error to pipe"); 
} 
if (pclose(fpin) == -1) 
err_sys("pclose error"); 
putchar('\n'); 
exit (0); 





图 15-15 调用 大 写 / 小 写 过 滤 程 序 读 取 命 令 
因为 标准 输出 通常 是 行 缓冲 的 ， 而 提示 并 不 包含 换行 符 ， 所 以 在 写 了 提示 之 后 ， 需 要 调用 
fflush. a 


15.4 ”协同 进程 


UNIX 系统 过 滤 程 序 从 标准 输入 读 取 数据 ， 向 标准 输出 写 数 据 。 儿 个 过 滤 程 序 通 常 在 shell 管 
道中 线性 连接 。 当 一 个 过 滤 程 序 既 产生 某 个 过 滤 程 序 的 输入 ， 又 读 取 该 过 滤 程 序 的 输出 时 ， 它 就 
变 成 了 协同 进程 (coprocess)。 

Korn shell 提供 了 协同 进程 [Bolsky and Korn 1995]。Bourne shell、Bourne-again shell 和 C shell 
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并 没有 提供 将 进程 连接 成 协同 进程 的 方法 。 协 同 进程 通常 在 shell 的 后 台 运 行 , 其 标准 输入 和 标准 
输出 通过 管道 连接 到 另 一 个 程序 。 虽 然 初 始 化 一 个 协同 进程 ， 并 将 其 输入 和 输出 连接 到 另 一 个 进 
程 的 shell 语法 是 十 分 奇特 的 (详细 情况 见 Bolsky 和 Korn[1995] 中 的 第 62—63 页 )， 但 是 协同 进 
程 的 工作 方式 在 C 程序 中 也 是 非常 有 用 的 。 

popen 只 提供 连接 到 另 一 个 进程 的 标准 输入 或 标准 输出 的 一 个 单 向 管道 ， 而 协同 进程 则 有 连 
接 到 另 一 个 进程 的 两 个 单 向 管道 : 一 个 接 到 其 标准 输入 ， 另 一 个 则 来 自 其 标准 输出 。 我 们 想 将 数 
据 写 到 其 标准 输入 ， 经 其 处 理 后 ， 再 从 其 标准 输出 读 取 数据 。 


aw Bl 
让 我 们 通过 一 个 实例 来 观察 协同 进程 。 进 程 创 建 两 个 管道 : 一 个 是 协同 进程 的 标准 输入 ， 另 
一 个 是 协同 进程 的 标准 输出 。 图 15-16 显示 了 这 父 进程 子 进程 ( 协同 进程 ) 
种 安排 。 fdl[1] 管道 1 stdin 
图 15-17 中 的 程序 是 一 个 简单 的 协同 进程 | 
gy = sx $ " [0] SHE stdout 
它 从 其 标准 输入 读 取 两 个 数 ， 计 算 它们 的 和 ， 然 
后 将 和 写 至 其 标准 输出 。( 协 同 进程 通常 会 做 较 图 15-16 通过 写 协同 进程 的 标准 输入 和 
此 更 有 意义 的 工作 。 设 计 本 实例 的 目的 是 帮助 了 a a A 
解 将 进程 连接 起 来 所 需 的 各 种 管道 设施 。) 
finclude "apue.h" 
int 
main(void) 
{ 
int h, intl, int2? 
char line[MAXLINE]; 
while ((n = read(STDIN FILENO, line, MAXLINE)) > 0) { 
line[n] = 0; /* null terminate */ 
if (sscanf(line, "&d$d", &intl, &int2) == 2) { 
sprintf (line, "%d\n", intl + int2); 
n = strlen(line); 
if (write(STDOUT FILENO, line, n) !- n) 
err sys("write error"); 
) else ( 
if (write(STDOUT FILENO, "invalid args\n", 13) != 13) 


err sys("write error"); 
} 
} 
exit (0); 


图 15-17 将 两 个 数 相 加 的 简单 过 滤 程 序 


对 此 程序 进行 编译 ， 将 其 可 执行 目标 代码 存 入 名 为 add2 的 文件 。 
图 15-18 中 的 程序 从 其 标准 输入 读 取 两 个 数 之 后 调用 add2 协同 进程 ， 并 将 协同 进程 送 来 的 
值 写 到 其 标准 输出 。 


#include "apue.h" 


15.4 协同 进程 





static void sig_pipe(int); /* our signal handler */ 


int 


main (void) 


{ 


int n, fdi[2], fd2[2]; 

pid t pid; 

char line [MAXLINE]; 

if (signal(SIGPIPE, sig_pipe) == SIG_ERR) 


err_sys("signal error"); 


if (pipe(fdl) < 0 || pipe(fd2) < 0) 
err_sys("pipe error"); 


if ((pid = fork()) < 0) { 
err_sys("fork error"); 

} else if (pid > 0) { /* parent */ 
close (fd1[0]); 
close (fd2[1]); 


while (fgets(line, MAXLINE, stdin) != NULL) { 
n = strlen(line); 
if (write(fd1[1], line, n) !- n) 


err sys("write error to pipe"); 

if ((n = read(fd2[0], line, MAXLINE)) < 0) 
err sys("read error from pipe"); 

if (n == 0) { 
err_msg("child closed pipe"); 


break; 
} 
line[n] = 0; /* null terminate */ 
if (fputs(line, stdout) == EOF) 


err_sys("fputs error"); 


if (ferror(stdin) ) 
err_sys("fgets error on stdin"); 
exit (0); 
} else { /* child */ 
close (fd1[1]); 
close (fd2[0]); 
if (fd1[0] != STDIN FILENO) { 
if (dup2(fd1[0], STDIN FILENO) !- STDIN FILENO) 
err sys("dup2 error to stdin"); 
close (fd1[0]); 


if (fd2[1] != STDOUT FILENO) { 
if (dup2(fd2[1], STDOUT FILENO) !- STDOUT FILENO) 
err sys("dup2 error to stdout"); 
close(fd2[11); 
} 
if (execl("./add2", "add2", (char *)0) « 0) 
err sys("execl error"); 
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exit(0); 


static void 

sig pipe(int signo) 

{ 
printf ("SIGPIPE caught\n") ; 
exit(1); 


15-18 ”驱动 add2 过 滤 程 序 的 程序 
这 个 程序 创建 了 两 个 管道 ， 父 进程 、 子 进程 各 自 关闭 它们 不 需 使 用 的 管道 端 。 必 须 使 用 两 个 
管道 : 一 个 用 作协 同 进程 的 标准 输入 ， 另 一 个 则 用 作 它 的 标准 输出 。 然 后 ， 子 进程 调用 dup2 使 
管道 描述 符 移 至 其 标准 输入 和 标准 输出 ， 最 后 调用 了 execl. 
若 编译 和 运行 图 15-18 中 的 程序 ， 它 会 按 预期 工作 。 此 外 ， 若 图 15-18 中 的 程序 在 等 待 输入 
的 时 候 杀 死 了 add2 协同 进程 ， 然 后 又 输入 两 个 数 ， 那 么 程序 对 没有 读 进 程 的 管道 进行 写 操作 时 ， 
会 调用 信和 号 处 理 程序 〈 见 习题 15.4). a 


m XA 


在 协同 进程 add2〈 见 图 15-17) F, 我 们 故意 使 用 了 底层 IO (UNIX 系统 调用 ): read 和 write. 
如 果 使 用 标准 VO 来 改写 该 协同 进程 ， 会 怎么 样 呢 ? 图 15-19 所 示 的 程序 就 是 改写 后 的 版 本 。 
#include "apue.h" 
int 


main (void) 


{ 


int inti, int2; 
char line[MAXLINE]; 
while (fgets(line, MAXLINE, stdin) !- NULL) { 
if (sscanf(line, "$d$d", &intl, &int2) == 2) { 
if (printf("$d\n", intl + int2) == EOF) 
err_sys("printf error"); 
} else { 
if (printf("invalid args\n") == EOF) 


err_sys("printf error"); 
} 
} 
exit(0); 


15-19 ”将 两 个 数 相 加 的 过 滤 程 序 ， 使 用 标准 UO 
若 图 15-18 中 的 程序 调用 这 个 新 的 协同 进程 ， 则 它 不 再 工作 。 问 题 出 在 默认 的 标准 IO 缓冲 机 制 
上 。 当 调用 图 15-19 中 的 程序 时 ， 对 标准 输入 的 第 一 个 fgets 引起 标准 VO 库 分 配 一 个 缓冲 区 ， 并 选 
择 缓冲 的 类 型 。 因 为 标准 输入 是 一 个 管道 ， 所 以 标准 IO 库 默 认 是 全 缓冲 的 。 标 准 输出 也 是 如 此 。 当 
add2 从 其 标准 输入 读 取 而 发 生 阻塞 时 ， 图 15-18 中 的 程序 从 管道 读 时 也 发 生 阻塞 , 于 是 产生 了 死 锁 。 
这 里 ， 可 以 对 将 要 运行 的 这 一 协同 进程 加 以 控制 。 我 们 可 以 修改 图 15-19 中 的 程序 ， 在 
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while 循环 之 前 加 上 下 面 4 行 : 
if (setvbuf (stdin, NULL, _IOLBF, 0) != 0) 
err_sys("setvbuf error"); 
if (setvbuf (stdout, NULL, _IOLBF, 0)!= 0) 


err sys("setvbuf error"); 
这 些 代码 行使 得 : 当 有 一 行 可 用 时 ，fgets 就 返回 ; 当 输 出 一 个 换行 符 时 ，printf 立即 执行 
fflush 操作 。 对 setvbuf 进行 的 这 些 显 式 调用 使 得 图 15-19 中 的 程序 能 正常 工作 了 。 
如 果 不 能 修改 管道 输出 的 目标 程序 ， 则 需 使 用 其 他 技术 。 例 如 ， 如 果 在 程序 中 使 用 awk(1) 
作为 协同 进程 (代替 add2 程序 )， 则 下 列 命令 行 不 能 工作 : 


#! /bin/awk/ -f 
{ print $1 + $2 } 


不 能 工作 的 原因 还 是 标准 IO 的 缓冲 机 制 问 题 .但 是 在 这 种 情况 下 , 无 法 改变 awk 的 工作 方式 ( 除 
JEA awk 的 源 代码 )。 我 们 不 能 修改 awk 的 可 执行 代码 ， 于 是 也 就 不 能 更 改 处 理 其 标准 IO 缓冲 
的 方式 。 

对 这 种 问题 的 一 般 解 决 方法 是 使 被 调用 在 本 例 中 是 awk) 的 协同 进程 认为 它 的 标准 输入 和 
输出 都 被 连接 到 了 一 个 终端 。 这 使 得 协同 进程 中 的 标准 IO 例 程 对 这 两 个 IO 流 进行 行 缓冲 ， 这 
类 似 于 前 面 所 做 的 显 式 调用 setvbuf。 第 19 章 将 用 伪 终 端 实现 这 种 方法 。 a 


15.5 FIFO 


FIFO 有 时 被 称 为 命名 管道 。 未 命名 的 管道 只 能 在 两 个 相关 的 进程 之 间 使 用 , 而 且 这 两 个 相关 
的 进程 还 要 有 一 个 共同 的 创建 了 它们 的 祖先 进程 。 但 是 ， 通 过 FIFO， 不 相关 的 进程 也 能 交换 数据 。 

第 14 章 中 已 经 提 及 FIFO 是 一 种 文件 类 型 。 通过 stat 结构 ( 见 4.2 节 ) 的 st mode WA RI 
编码 可 以 知道 文件 是 否 是 FIFO 类 型 。 可 以 用 S_ISFIFO 宏 对 此 进行 测试 。 

创建 FIFO 类 似 于 创建 文件 。 确 实 ，FIFO 的 路 径 名 存在 于 文件 系统 中 。 


#include <sys/stat.h> 


int mkfifo(const char *path, mode_t mode) ; 


int mkfifoat(int fd, const char *path, mode t mode); 


两 个 函数 的 返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 一 1 





mkfifo 函数 中 mode 参数 的 规格 说 明 与 open 函数 中 mode 的 相同 CJ 3.3 节 )。 新 FIFO 的 
用 户 和 组 的 所 有 权 规 则 与 4.6 节 所 述 的 相同 。 

mkfifoat 函数 和 mkfifo 函数 相似 ， 但 是 mkfifoat 函数 可 以 被 用 来 在 大 文件 描述 符 表 
示 的 目录 相关 的 位 置 创建 一 个 FIFO。 像 其 他 *at 函数 一 样 ， 这 里 有 3 种 情形 : 

(1) 如 果 path 参数 指定 的 是 绝对 路 径 名 ， 则 应 参数 会 被 忽略 掉 ， 并 且 mkfifoat 函数 的 行 
为 和 mkfifo 类 似 。 

(2) 如 果 path 参数 指定 的 是 相对 路 径 名 ， 则 fd 参数 是 一 个 打开 目录 的 有 效 文件 描述 符 ， 路 
径 名 和 目录 有 关 。 

(3) 如 果 path 参数 指定 的 是 相对 路 径 名 ， 并 且 fa 参数 有 一 个 特殊 值 AT_FDCWD， 则 路 径 名 
以 当前 目录 开始 ，mkfifoat 和 mkfifo 类 似 。 
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当 我 们 用 mkfifo 或 者 mkfifoat 创建 FIFO 时 ， 要 用 open 来 打开 它 。 确 实 ， 正 常 的 文件 
LO 函数 (如 close. read. write Ñl unlink) 都 需要 FIFO。 


应 用 程序 可 以 用 mknod 和 mknodat 函数 创建 FIFO。 因 为 POSIX.1 原先 并 没有 包括 mknod 
函数 ， 所 以 mkfifo 是 专门 为 POSIX.1 设计 的 。mknod fe mknodat 函数 现在 已 包括 在 POSIX.1 
| 的 XSI 扩展 中 。 
POSIX.1 也 包括 了 对 mkfifo(1) 命 令 的 支持 。 本 书 讨论 的 4 种 平台 都 提供 此 命令 。 因 此 ， 可 
， 以 用 一 条 shell 命令 创建 一 个 FIFO， 然 后 用 一 般 的 shell UO 重 定向 对 其 进行 访问 。 


当 open 一 个 FIFO 时 ， 非 阻塞 标志 (CO NONBLOCKO 会 产生 下 列 影 响 。 
e 在 一 般 情 况 下 〈 没 有 指定 O_ NONBLOCK)， 只 读 open 要 阻塞 到 某 个 其 他 进程 为 写 而 打开 
这 个 FIFO 为 止 。 类 似 地 ， 只 写 open 要 阻塞 到 某 个 其 他 进程 为 读 而 打开 它 为 止 。 
。 如 果 指 定 了 0_NONBLOCK， 则 只 读 open 立即 返回 。 但 是 ， 如 果 没 有 进程 为 读 而 打开 一 
^ FIFO, WARS open 将 返回 -1， 并 将 errno 设置 成 ENXIO。 
类 似 于 管道 ， 若 write 一 个 尚 无 进程 为 读 而 打开 的 FIFO， 则 产生 信号 SIGPIPE。 若 某 个 
FIFO 的 最 后 一 个 写 进 程 关 闭 了 该 FIFO， 则 将 为 该 FIFO 的 读 进程 产生 一 个 文件 结束 标志 。 
一 个 给 定 的 FIFO 有 多 个 写 进 程 是 常见 的 。 这 就 意味 着 ， 如 果 不 希 望 多 个 进程 所 写 的 数据 交 
又， 则 必须 考虑 原子 写 操 作 。 和 管道 一 样 ， 常 量 PIPE_BUF 说 明了 可 被 原子 地 写 到 FIFO 的 最 大 
数据 量 。 
FIFO 有 以 下 两 种 用 途 。 
(1) shell 命令 使 用 FIFO 将 数据 从 一 条 管道 传送 到 另 一 条 时 ， 无 需 创建 中 间 临 时 文件 。 
(2) 客户 进程 -服务 器 进程 应 用 程序 中 ，FIFO 用 作 汇 聚 点 ， 在 客户 进程 和 服务 器 进程 二 者 之 
间 传 递 数据 。 
我 们 各 用 一 个 实例 来 说 明 这 两 种 用 途 。 


s XI: 用 FIFO 复制 输出 流 
FIFO 可 用 于 复制 一 系列 sell 命令 中 的 输出 流 。 这 就 防止 了 将 数据 写 向 中 间 磁 盘 文 件 (类 似 于 
使 用 管道 来 避免 中 间 磁 盘 文 件 )。 但 是 不 同 的 是 ， 
管道 只 能 用 于 两 个 进程 之 间 的 线性 连接 , 而 FIFO 
是 有 名 字 的 ， 因 此 它 可 用 于 非 线性 连接 。 
考虑 这 样 一 个 过 程 ， 它 需要 对 一 个 经 过 过 滤 的 
输入 流 进 行 两 次 处 理 。 图 15-20 显示 了 这 种 安排 。 
使 用 FIFO 和 UNIX 程序 tee(1) 就 可 以 实现 








这 样 的 过 程 而 无 需 使 用 临时 文件 。(tee 程序 将 图 15-20 ”对 一 个 经 过 过 滤 的 输入 
其 标准 输入 同时 复制 到 其 标准 输出 以 及 其 命令 流 进行 两 次 处 理 的 过 程 
行 中 命名 的 文件 中 。) 


mkfifo fifol 
prog3 < fifol & 
progl < infile | tee fifol | prog2 


创建 FIFO， 然 后 在 后 台 启 动 prog3， 从 FIFO 读数 据 。 然 后 启动 brog1， 用 tee 将 其 输出 
发 送 到 FIFO 和 prog2。 图 15-21 显示 了 进程 安排 。 E] 
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图 15-21 使 用 FIFO 和 tee 将 一 个 流 发 送 到 两 个 不 同 的 进程 
纪实 例 : 使 用 FIFO 进行 客户 进程 -服务 器 进程 通信 





FIFO 的 另 一 个 用 途 是 在 客户 进程 和 服务 器 进程 之 间 传 送 数据 。 如 果 有 一 个 服务 器 进程 ， 它 与 
很 多 客户 进程 有 关 ， 每 个 客户 进程 都 可 将 其 请 求 写 到 一 个 该 服务 器 进程 创建 的 众所周知 的 FIFO 中 
(“众所周知 ”的 意思 是 : 所 有 需 与 服务 器 进程 联系 的 客户 进程 都 知道 该 FIFO 的 路 径 名 )。 图 15-22 


显示 了 这 种 安排 。 

因为 该 FIFO 有 多 个 写 进程 ， 所 以 客户 进程 发 
送 给 服务 器 进程 的 请 求 的 长 度 要 小 于 PIPE_BUF 字 
节 。 这 样 就 能 避免 客户 进程 的 多 次 写 之 间 的 交叉 。 

在 这 种 类 型 的 客户 进程 -服务 器 进程 通信 中 
使 用 FIFO 的 问题 是 : 服务 器 进程 如 何 将 回答 送 回 
各 个 客户 进程 。 不 能 使 用 单个 FIFO， 因 为 客户 进 
程 不 可 能 知道 何 时 去 读 它 们 的 响应 以 及 何 时 响应 
其 他 客户 进程 。 一 种 解决 方法 是 ， 每 个 客户 进程 
都 在 其 请 求 中 包含 它 的 进程 D。 然 后 服务 器 进程 
为 每 个 客户 进程 创建 一 个 FIFO, 所 使 用 的 路 径 名 
是 以 客户 进程 的 进程 ID 为 基础 的 。 例 如 ， 服 务 器 
进程 可 以 用 名 字 /tmp/serv1.XXXXX 创建 FIFO， 







众所周知 的 
FIFO 


15-22 ”客户 进程 用 FIFO 向 
服务 器 进程 发 送 请 求 
其 中 xxxxx 被 替换 成 客户 进程 的 进程 DD。 图 15-23 显示 了 这 种 安排 。 





图 15-23 ”用 FIFO 进行 客户 进程 -服务 器 进程 通信 
虽然 这 种 安排 可 以 工作 ， 但 服务 器 进程 不 能 判断 一 个 客户 进程 是 否 裔 溃 终 止 ， 这 就 使 得 客户 
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进程 专用 FIFO 会 遗留 在 文件 系统 中 。 另 外 ， 服 务 器 进程 还 必须 得 捕捉 SIGPIPE 信和 号， 因为 客户 
进程 在 发 送 一 个 请 求 后 有 可 能 没有 读 取 响 应 就 终止 了 ， 于 是 留 下 一 个 只 有 写 进 程 〈 服 务 器 进程 ) 
而 无 读 进 程 的 客户 进程 专用 FIFO. 

按照 图 15-23 中 的 安排 ， 如果 服 务 器 进程 以 只 读 方 式 打 开 众所周知 的 FIFO (因为 它 只 需 读 该 
FIFO)， 则 每 当 客 户 进 程 个 数 从 1 变 成 0 时 ， 服 务 器 进程 就 将 在 FIFO 中 读 到 (read) 一 个 文件 
结束 标志 。 为 使 服务 器 进程 免 于 处 理 这 种 情况 , 一 种 常用 的 技巧 是 使 服务 器 进程 以 读 - 写 方式 打开 
该 众所周知 的 FIFO( 见 习题 15.10). "m 


15.6 XSIIPC 


有 3 种 称 作 XSI IPC 的 IPC: 消息 队列 、 信 和 号 量 以 及 共享 存储 器 。 它 们 之 间 有 很 多 相似 之 处 。 
本 节 先 介绍 它们 相 类 似 的 特征 ， 后 面 儿 节 将 说 明 这 些 IPC 各 自 的 特殊 功能 。 


XSI IPC 函数 是 紧密 地 基于 System V 的 IPC 函数 的 。 这 3 种 类 型 的 XSIIPC 源 自 于 1970 年 的 
一 种 称 为 “Columbus UNIX” 的 AT&T 内 部 版 本 。 后 来 它们 被 添加 到 System V 上 。 由 于 XSIIPC 
不 使 用 文件 系统 命名 空间 ， 而 是 构造 了 它们 自己 的 命名 空间 ， 为 此 常常 受到 批评 。 


15.6.1 标识 符 和 键 


每 个 内 核 中 的 IPC 结构 (消息 队列 、 信 号 量 或 共享 存储 段 〉 都 用 一 个 非 负 整数 的 标识 符 
(identifier) 加 以 引用 。 例 如 ， 要 向 一 个 消息 队列 发 送 消息 或 者 从 一 个 消息 队列 取消 息 ， 只 需要 知道 
其 队列 标识 符 。 与 文件 描述 符 不 同 ，IPC 标识 符 不 是 小 的 整数 。 当 一 个 IPC 结构 被 创建 ， 然 后 又 被 
删除 时 ， 与 这 种 结构 相关 的 标识 符 连 续 加 1， 直 至 达到 一 个 整 型 数 的 最 大 正 值 ， 然 后 又 回转 到 0。 

标识 符 是 IPC 对 象 的 内 部 名 。 为 使 多 个 合作 进程 能 够 在 同一 IPC 对 象 上 汇聚 ， 需 要 提供 一 个 
外 部 命名 方案 。 为 此 ， 每 个 IPC 对 象 都 与 一 个 键 Chey) 相关 联 ， 将 这 个 键 作 为 该 对 象 的 外 部 名 。 

无 论 何 时 创建 IPC 结构 (通过 调用 msgget、semget 或 shmget 创建 )， 都 应 指定 一 个 键 。 
这 个 键 的 数据 类 型 是 基本 系统 数据 类 型 key t， 通 常 在 头 文件 <sys/types .h> 中 被 定义 为 长 整 
型 。 这 个 键 由 内 核 变 换 成 标识 符 。 

有 多 种 方法 使 客户 进程 和 服务 器 进程 在 同一 IPC 结构 上 汇聚。 

(1) 服务 器 进程 可 以 指定 键 IPC PRIVATE 创建 一 个 新 IPC 结构 ， 将 返回 的 标识 符 存放 在 某 
处 〈 如 一 个 文件 ) 以 便 客户 进程 取 用 。 键 IPC_PRIVRTE 保证 服务 器 进程 创建 一 个 新 IPC 结构 。 
这 种 技术 的 缺点 是 : 文件 系统 操作 需要 服务 器 进程 将 整 型 标识 符 写 到 文件 中 ， 此 后 客户 进程 又 要 
读 这 个 文件 取得 此 标识 各 

IPC PRIVATE 键 也 可 用 于 父 进程 子 关 系 。 父 进程 指定 IPC PRIVATE 创建 一 个 新 IPC 结构 ， 
所 返回 的 标识 符 可 供 fork 后 的 子 进程 使 用 。 接 着 ， 子 进程 又 可 将 此 标识 符 作 为 exec 函数 的 一 
个 参数 传 给 一 个 新 程序 。 

(2) 可 以 在 一 个 公用 头 文件 中 定义 一 个 客户 进程 和 服务 器 进程 都 认可 的 键 。 然 后 服务 器 进程 
指定 此 键 创 建 一 个 新 的 IPC 结构 。 这 种 方法 的 问题 是 该 键 可 能 已 与 一 个 IPC 结构 相 结合 ， 在 此 情 
况 下 ，get 函数 (msgget. semget 或 shmget) 出 错 返 回 。 服务器 进程 必须 处 理 这 一 错误 ， 删 
除 已 存在 的 IPC 结构 ， 然 后 试 着 再 创建 它 。 

(3) 客户 进程 和 服务 器 进程 认同 一 个 路 径 名 和 项 目 ID. CRH DD 是 0~255 之 间 的 字符 值 )， 
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接着 ， 调 用 函数 ftok 将 这 两 个 值 变换 为 一 个 键 。 然 后 在 方法 OD 中 使 用 此 键 。ftok 提供 的 唯 
一 服务 就 是 由 一 个 路 径 名 和 项 目 ID 产生 一 个 键 。 
#include <sys/ipc.h> 


key_t ftok(const char *path, int id); 





返回 值 : 车 成 功 ， 返 回 键 ; 若 出 错 ， 返 回 (key t)-1 


path 参数 必须 引用 一 个 现 有 的 文件 。 当 产生 键 时 ， 只 使 用 这 参数 的 低 8 位。 

ftok 创建 的 键 通常 是 用 下 列 方式 构成 的 : 按 给 定 的 路 径 名 取得 其 stat 结构 〈 见 42 节 ) 中 
的 部 分 st_dev 和 st_ino 字段 ， 然 后 再 将 它们 与 项 目 ID 组 合 起 来 。 如 果 两 个 路 径 名 引用 的 是 两 
个 不 同 的 文件 ， 那 么 ftok 通常 会 为 这 两 个 路 径 名 返回 不 同 的 键 。 但 是 ， 因 为 i 节点 编号 和 键 通常 
都 存放 在 长 整 型 中 ， 所 以 创建 键 时 可 能 会 丢失 信息 。 这 意味 着 ， 对 于 不 同文 件 的 两 个 路 径 名 ， 如 果 
使 用 同一 项 目 ID， 那 么 可 能 产生 相同 的 键 。 

3 个 get MM (msgget、semget 和 shmget) 都 有 两 个 类 似 的 参数 : 一 个 key 和 一 个 整 型 
flag. 在 创建 新 的 IPC 结构 (通常 由 服务 器 进程 创建 ) 时 ， 如 果 key 是 IPC PRIVATE 或 者 和 当前 
某 种 类 型 的 IPC 结构 无 关 ， 则 需要 指明 flag 的 IPC CREAT 标志 位 。 为 了 引用 一 个 现 有 队列 GR 
常 由 客户 进程 创建 )，key 必须 等 于 队列 创建 时 指明 的 key 的 值 ， 并且 IPC CREAT 必须 不 被 指明 。 

注意 ， 决 不 能 指定 IPC PRIVATE 作为 键 来 引用 一 个 现 有 队列 ， 因 为 这 个 特殊 的 键 值 总 是 
用 于 创建 一 个 新 队列 。 为 了 引用 一 个 用 IPC_PRIVATE 键 创建 的 现 有 队列 ， 一 定 要 知道 这 个 相 
关 的 标识 符 ， 然 后 在 其 他 IPC 调用 中 (如 msgsnd、msgrcv) 使 用 该 标识 符 ， 这 样 可 以 绕 过 
get AM. 

如 果 希 望 创 建 一 个 新 的 IPC 结构 ， 而 且 要 确保 没有 引用 具有 同一 标识 符 的 一 个 现 有 IPC 结构 ， 
那么 必须 在 flag 中 同时 指定 IPC CREAT 和 IPC_EXCL 位 。 这样 做 了 以 后 ， 如 果 IPC 结构 已 经 存 
在 就 会 造成 出 错 ， 返 回 EEXIST (这 与 指定 了 O CREAT 和 O_EXCL 标志 的 open 相 类 似 )。 


15.6.2 ”权限 结构 


XSI IPC 为 每 一 个 IPC 结构 关联 了 一 个 ipc perm 结构 。 该 结构 规定 了 权限 和 所 有 者 ， 它 至 
少 包括 下 列 成 员 : 
struct ipc perm { 
uid t uid; /* owner's effective user id */ 
gid t gid; /* owner's effective group id */ 
uid t cuid; /* creator's effective user id */ 
gid t cgid; /* creator's effective group id */ 
mode t mode; /* access modes */ 


每 个 实现 会 包括 另外 一 些 成 员 。 如 欲 了 解 你 所 用 系统 中 它 的 完整 定义 ， 请 参见 <sys/ipc.h>。 

在 创建 IPC 结构 时 ， 对 所 有 字段 都 赋 初 值 。 以 后 ， 可 以 调用 msgctl. semctl 或 shmctl 
修改 uid、gid 和 mode 字段 。 为 了 修改 这 些 值 ， 调 用 进程 必须 是 IPC 结构 的 创建 者 或 超级 用 户 。 
修改 这 些 字 段 类 似 于 对 文件 调用 chown 和 chmod。 

mode 字段 的 值 类 似 于 图 4-6 中 所 示 的 值 ， 但 是 对 于 任何 IPC 结构 都 不 存在 执行 权限 。 另 外 ， 消 
息 队列 和 共享 存储 使 用 术语 “ 读 ” 和 “和 写 ”， 而 信号 量 则 用 术语 “ 读 ” 和 “更 改 ” (alter)。 图 15-24 
显示 了 每 种 IPC 的 6 种 权限 。 558 
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用 户 读 0400 
用 户 写 (更 改 ) 0200 

0040 
组 写 (更 改 ) 0020 
其 他 读 0004 
其 他 写 CEK 0002 

图 15-24 XSI IPC 权限 
某 些 实现 定义 了 表示 每 种 权限 的 符号 常量 ， 但 是 这 些 常 量 并 不 包括 在 Single UNIX Specification 中 。 


15.6.3 ”结构 限制 


所 有 3 种 形式 的 XSI IPC 都 有 内 置 限制 。 大 多 数 限制 可 以 通过 重新 配置 内 核 来 改变 。 在 对 这 
3 种 形式 的 IPC 中 的 每 一 种 进行 描述 时 ， 我 们 都 会 指出 它 的 限制 。 
在 报告 和 修改 限制 方面 ， 每 种 平台 都 有 自己 的 方法 。FreeBSD 8.0, Linux 3.2.0 f» Mac OS X 
10.6.8 提供 了 sysctl 命令 来 观察 和 修改 内 核 配 置 参数 。 在 Solaris 10 P, TAA prctl 命令 来 
改变 内 核 IPC 的 限制 。 
Æ Linux 中 ， 可 以 运行 ipcs -1 来 显示 IPC 相关 的 限制 。 在 FreeBSD 中 ， 等 效 的 命令 是 ipcs 
-To Æ Solaris 中 ， 可 以 通过 运行 sysdef -y 来 找到 可 调节 参数。 


15.6.4 优点 和 缺点 


XSI IPC 的 一 个 基本 问题 是 : IPC 结构 是 在 系统 范围 内 起 作用 的 ， 没 有 引用 计数 。 例 如 ， 如 
果 进 程 创 建 了 一 个 消息 队列 ， 并 且 在 该 队列 中 放 入 了 几 则 消息 ， 然 后 终止 ， 那么 该 消息 队列 及 其 
内 容 不 会 被 删除 。 它 们 会 一 直 留 在 系统 中 直至 发 生 下 列 动 作为 止 : 由 某 个 进程 调用 msgrcv 或 
msgctl 读 消 息 或 删除 消息 队列 ; 或 某 个 进程 执行 ijpcrm(1) 命 令 删 除 消息 队列 ; 或 正在 自 举 的 系 
统 删除 消息 队列 。 将 此 与 管道 相 比 ， 当 最 后 一 个 引用 管道 的 进程 终止 时 ， 管 道 就 被 完全 地 删除 了 。 
对 于 FIFO 而 言 ， 在 最 后 一 个 引用 FIFO 的 进程 终止 时 ， 虽 然 FIFO 的 名 字 仍 保留 在 系统 中 ， 直 至 
被 显 式 地 删除 ， 但 是 留 在 FIFO 中 的 数据 已 被 删除 了 。 

XSI IPC 的 另 一 个 问题 是 : 这些 IPC 结构 在 文件 系统 中 没有 名 字 。 我 们 不 能 用 第 3 章 和 第 4 章 中 
所 述 的 函数 来 访问 它们 或 修改 它们 的 属性 。 为 了 支持 这 些 IPC 对 象 ， 内 核 中 增加 了 十 几 个 全 新 的 系统 
调用 (msgget、semop、shmat 等 )。 我 们 不 能 用 1s 命令 查看 IPC 对 象 ， 不 能 用 rm 命令 删除 它们 ， 

也 不 能 用 chmod 命令 修改 它们 的 访问 权限 。 于 是 ， 又 增加 了 两 个 新 命令 ipcs(1) 和 ipcrm(1). 
因为 这 些 形式 的 IPC 不 使 用 文件 描述 符 ， 所 以 不 能 对 它们 使 用 多 路 转 接 IO A% (select 
和 pol1)。 这 使 得 它 很 难 一 次 使 用 一 个 以 上 这 样 的 IPC 结构 ， 或 者 在 文件 或 设备 IO 中 使 用 这 样 
的 IPC 结构 。 例 如 ， 如 果 没 有 某 种 形式 的 忙 等 循环 (busy-wait loop)， 就 不 能 使 一 个 服务 器 进程 
等 待 将 要 放 在 两 个 消息 队列 中 任意 一 个 中 的 消息 。 

Andrade、Carges 和 Kovach[1989] 对 使 用 System V IPC 构建 的 一 个 事务 处 理 系 统 进行 了 综述 。 
他 们 认为 System V IPC 使 用 的 命名 空间 (标识 符 ) 是 一 个 优点 ， 而 不 是 前 面 所 说 的 问题 ， 理 由 是 
使 用 标识 符 使 一 个 进程 只 要 使 用 单个 函数 调用 (msgsnd) 就 能 将 一 个 消息 发 送 到 一 个 队列 ， 而 
其 他 形式 的 IPC 则 通常 还 要 调用 open. write 和 close。 这 种 说 法 是 错误 的 。 为 了 避免 使 用 键 
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和 调用 msgget， 客 户 进 程 总 要 以 某 种 方式 获得 服务 器 进程 队列 的 标识 符 。 分 派 给 特定 队列 的 标 
识 符 取决 于 在 创建 该 队列 时 ， 有 多 少 消息 队列 已 经 存在 ， 也 取决 于 自 内 核 自 举 以 来 ， 内 核 中 将 分 
配给 新 队列 的 表 项 已 经 使 用 了 多 少 次 。 这 是 一 个 动态 值 ， 无 法 猜 到 或 事先 存放 在 一 个 头 文件 中 。 
正如 15.6.1 节 所 述 ， 至 少 服务 器 进程 应 将 分 配给 队列 的 标识 符 写 到 一 个 文件 中 以 便 客户 进程 读 取 。 

这 些 作 者 列举 的 消息 队列 的 其 他 优点 是 : 它们 是 可 靠 的 、 流 控制 的 以 及 面向 记录 的 ; 它们 可 
以 用 非 先进 先 出 次 序 处 理 。 图 15-25 对 这 些 不 同形 式 IPC 的 某 些 特征 进行 了 比较 。 


e 十 | 是 la|] = | 





消息 队列 

STREAMS 

UNIX 域 流 套 接 字 
UNIX 域 数据 报 套 接 字 
FIFO ( 非 STREAMS) 


是 





图 15-25 不 同形 式 IPC 之 间 的 特征 比较 

(我 们 将 在 第 16 章 中 描述 流 和 数据 报 套 接 字 ， 在 17.2 节 中 描述 UNIX 域 套 接 字 。) 图 15-25 
中 的 “无 连接 ” 指 的 是 无 需 先 调用 某 种 形式 的 打开 函数 就 能 发 送 消息 的 能 力 。 如 前 所 述 ， 因 为 需 
要 有 某 种 技术 来 获得 队列 标识 符 ， 所 以 我 们 并 不 认为 消息 队列 是 无 连接 的 。 因 为 所 有 这 些 形式 的 
IPC 被 限制 在 一 台 主 机 上 ， 所 以 它们 都 是 可 靠 的 。 当 消息 通过 网 络 传送 时 ， 就 要 考虑 丢失 消息 的 
可 能 性 。“ 流 控制 ”的 意思 是 : 如 果 系 统 资源 (缓冲 区 ) 短缺 ， 或 者 如 果 接 收 进程 不 能 再 接收 更 
多 消息 ， 则 发 送 进程 就 要 休眠 。 当 流 控 制 条 件 消失 时 ， 发 送 进程 应 自动 唤醒 。 

图 15-25 中 没有 显示 的 一 个 特征 是 : IPC 设施 能 否 自动 地 为 每 个 客户 进程 创建 一 个 到 服务 器 进 
程 的 唯一 连接 。 第 17 章 将 说 明 UNIX 流 套 接 字 可 以 提供 这 种 能 力 。 下 面 3 节 将 对 3 种 形式 的 XSIIPC 
进行 详细 的 描述 。 
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消息 队列 是 消息 的 链接 表 ， 存 储 在 内 核 中 ， 由 消息 队列 标识 符 标 识 。 在 本 节 中 ， 我 们 把 消息 
队列 简称 为 队列 ， 其 标识 符 简称 为 队列 ID。 
Single UNIX Specification 的 消息 传送 选项 中 包括 一 种 替代 的 IPC 消息 队列 接口 ， 该 接口 来 源 
于 POSIX 实时 扩展 。 本 书 不 讨论 这 个 接口 。 


msgget 用 于 创建 一 个 新 队列 或 打开 一 个 现 有 队列 。msgsnd 将 新 消息 添加 到 队列 尾 端 。 每 
个 消息 包含 一 个 正 的 长 整 型 类 型 的 字段 、 一 个 非 负 的 长 度 以 及 实际 数据 字 节 数 〈 对 应 于 长 度 )， 
所 有 这 些 都 在 将 消息 添加 到 队列 时 ， 传 送 给 msgsnd。msgrcv 用 于 从 队列 中 取消 息 。 我 们 并 不 
一 定 要 以 先进 先 出 次 序 取消 息 ， 也 可 以 按 消 息 的 类 型 字段 取消 息 。 

每 个 队列 都 有 一 个 msqid_ds 结构 与 其 相关 联 : 


struct msqid ds { 


struct ipc_perm msg_perm; /* see Section 15.6.2 */ 
msgqnum_t msg_qnum; /* # of messages on queue */ 
msglen_t msg_qbytes; /* max # of bytes on queue */ 
pid_t msg_lspid; /* pid of last msgsnd() */ 


pid_t msg_lrpid; /* pid of last msgrcv() */ 
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time_t msg_stime; /* last-msgsnd() time */ 
time_t msg_rtime; /* last-msgrcv() time */ 


time_t msg_ctime; /* last-change time */ 


he 
此 结构 定义 了 队列 的 当前 状态 。 结 构 中 所 示 的 各 成 员 是 由 Single UNIX Specification 定义 的 。 具 体 
实现 可 能 包括 标准 中 没有 定义 的 另 一 些 字段 。 

图 15-26 列 出 了 影响 消息 队列 的 系统 限制 。“ 导 出 的 ”表示 这 种 限制 来 源 于 其 他 限制 。 例 如 ， 
在 Linux 系统 中 ， 最 大 消息 数 是 根据 最 大 队列 数 和 队列 中 所 允许 的 最 大 数据 量 来 决定 的 。 其 中 最 
大 队列 数 还 要 根据 系统 上 安装 的 RAM 的 数量 来 决定 。 注 意 ， 队 列 的 最 大 字 节 数 限制 进一步 限制 
了 队列 中 将 要 存储 的 消息 的 最 大 长 度 。 

调用 的 第 一 个 函数 通常 是 msgget， 其 功能 是 打开 一 个 现 有 队列 或 创建 一 个 新 队列 。 


典型 值 
说 明 
FreeBSD 8.0 Linux 3. 2.0 Mac OS X 10. 6.8 Solaris 10 


可 发 送 的 最 长 消息 的 字 节 数 

一 个 特定 队列 的 最 大 字 节 数 ( 亦 即 队 
列 中 所 有 消息 长 度 之 和 ) 

系统 中 最 大 消息 队列 数 
系统 中 最 大 消息 数 








图 15-26 影响 消息 队列 的 系统 限制 


#include <sys/msg.h> 


int msgget(key t key, int flag); 





返回 值 : 若 成 功 ， 返 回 消息 队列 ID; 若 出 错 ， 返 回 一 1 

15.6.1 节 说 明了 将 key 变换 成 一 个 标识 符 的 规则 ， 并 且 讨 论 了 是 创建 一 个 新 队列 还 是 引用 一 
个 现 有 队列 。 在 创建 新 队列 时 ， 要 初始 化 msqiqd-ds 结构 的 下 列 成 员 。 

e ipc-perm 结构 按 15.6.2 节 中 所 述 进行 初始 化 。 该 结构 中 的 mode 成 员 按 flag 中 的 相应 

权限 位 设置 。 这 些 权 限 用 图 15-24 中 的 值 指定 。 

e msg qnum. msg lspid. msg lrpid. msg stime All msg_rtime 都 设置 为 0。 

。 msg_ctime 设置 为 当前 时 间 。 

。 msg_qbytes 设置 为 系统 限制 值 。 

车 执行 成 功 ，msgget 返回 非 负 队列 DDD。 此 后 ， 该 值 就 可 被 用 于 其 他 3 个 消息 队列 函数 。 

msgctl 函数 对 队列 执行 多 种 操作 。 它 和 另外 两 个 与 信号 量 及 共享 存储 有 关 的 函数 (semct1 
和 shmct1) 都 是 XSIIPC 的 类 似 于 ioctl 的 函数 〈 亦 即 垃 圾 桶 函数 )。 


#include <sys/msg.h> 


int msgctl(int msqid, int cmd, struct msqid ds *buf) ; 


返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 一 ! 





cmd 参数 指定 对 msqid 指定 的 队列 要 执行 的 命令 。 

IPC STAT ” 取 此 队列 的 msqiq_ds 结构 ， 并 将 它 存放 在 buf 指 问 的 结构 中 。 

IPC_SET 将 字段 msg perm.uid. msg perm.gid. msg perm.mode 和 msg qbytes 
从 buf 指向 的 结构 复制 到 与 这 个 队列 相关 的 msqiq_ds 结构 中 。 此 命令 只 能 由 下 列 
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两 种 进程 执行 : 一 种 是 其 有 效用 户 ID 等 于 msg_perm.cuid 或 msg perm.uid， 
另 一 种 是 具有 超级 用 户 特权 的 进程 。 只 有 超级 用 户 才能 增加 msg_qbytes 的 值 。 
IPC_RMID 从 系统 中 删除 该 消息 队列 以 及 仍 在 该 队列 中 的 所 有 数据 。 这 种 删除 立即 生效 。 
仍 在 使 用 这 一 消息 队列 的 其 他 进程 在 它们 下 一 次 试图 对 此 队列 进行 操作 时 ， 将 
得 到 EIDRM 错误 。 此 命令 只 能 由 下 列 两 种 进程 执行 ， 一 种 是 其 有 效用 户 ID 等 
T msg perm.cuid 或 msg_ perm.uid; 另 一 种 是 具有 超级 用 户 特权 的 进程 。 
这 3 条 命令 (IPC STAT. IPC SET 和 IPC_RMID) 也 可 用 于 信号 量 和 共享 存储 。 
调用 msgsnd 将 数据 放 到 消息 队列 中 。 


#include <sys/msg.h> 





int msgsnd(int msgid, const void *ptr, size t nbytes, int flag); 


返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 一 1 





正如 前 面 提 及 的 ， 每 个 消息 都 由 3 部 分 组 成 : 一 个 正 的 长 整 型 类 型 的 字段 、 一 个 非 负 的 长 度 
(nbytes) 以 及 实际 数据 字 节 数 〈 对 应 于 长 度 )。 消 息 总 是 放 在 队列 尾 端 。 
Ptr 参数 指向 一 个 长 整 型 数 , 它 包 含 了 正 的 整 型 消息 类 型 ,其 后 紧 接着 的 是 消息 数据 ( 若 nbytes 
是 0， 则 无 消息 数据 )。 若 发 送 的 最 长 消息 是 512 字 节 的 ， 则 可 定义 下 列 结构 : 
struct mymesg { 
long mtype; /* positive message type */ 


char mtext[512]; /* message data, of length nbytes */ 
}; 


ptr 就 是 一 个 指向 mymesg 结构 的 指针 。 接 收 者 可 以 使 用 消息 类 型 以 非 先进 先 出 的 次 序 取消 息 。 

某 些 平台 既 支 持 32 位 环境 又 支持 64 位 环境 。 这 影响 到 长 整 型 和 指针 的 大 小 。 例如， 在 64 
位 SPARC 系统 中 ，Solaris 允许 32 位 应 用 程序 和 64 位 应 用 程序 同时 存在 。 如 果 一 个 32 位 应 用 程 
序 要 经 由 管道 或 套 接 字 与 一 个 64 位 应 用 程序 交换 此 结构 ， 就 会 出 问题 。 因 为 在 32 位 应 用 程序 中 ， 
长 整 型 的 大 小 是 4 字 节 ， 而 在 64 位 应 用 程序 中 ， 长 整 型 的 大 小 是 8 字 节 。 这 意味 着 ，32 位 应 用 
程序 期 望 mtext 字段 在 结构 起 始 地 址 后 的 第 4 个 字 节 处 开始 , 而 64 位 应 用 程序 则 期 望 mtext F 
段 在 结构 起 始 地 址 后 的 第 8 个 字 节 处 开始 。 在 这 种 情况 下 ，64 位 应 用 程序 的 mtype 字段 的 一 部 
分 会 被 32 位 应 用 程序 视 为 mtext 字段 的 组 成 部 分 ， 而 32 位 应 用 程序 的 mtext 字段 的 前 4 个 字 
节 会 被 64 位 应 用 程序 解释 为 mtype 字段 的 组 成 部 分 。 

但 是 ，XSI 消息 队列 就 不 会 发 生 这 种 问题 。Solaris 实现 的 IPC 系统 调用 的 32 位 版 本 和 64 位 
版 本 具有 不 同 的 入 口 点 。 这 些 系统 调用 知道 如 何 处 理 32 位 应 用 程序 与 64 位 应 用 程序 的 通信 操作 ， 
并 对 类 型 字段 做 了 特殊 处 理 以 避免 它 干 扰 消 息 的 数据 部 分 。 唯 一 的 潜在 问题 是 ， 当 64 位 应 用 程序 
向 32 位 应 用 程序 发 送 消息 时 ， 如 果 它 在 8 字 节 类 型 字段 中 设置 的 值 大 于 32 位 应 用 程序 中 4 字 节 
类 型 字段 可 表示 的 值 ， 那 么 32 位 应 用 程序 在 其 mtype 字段 中 得 到 的 将 是 一 个 截 短 了 的 类 型 值 。 


参数 flag 的 值 可 以 指定 为 IPC_NOWAIT。 这 类 似 于 文件 IO 的 非 阻塞 IO pra CA 14.2 节 )。 
若 消 息 队 列 已 满 (或 者 是 队列 中 的 消息 总 数 等 于 系统 限制 值 ， 或 队列 中 的 字 节 总 数 等 于 系统 限制 
值 )， 则 指定 IPC NOWAIT 使 得 msgsnd 立即 出 错 返回 EAGAIN。 如 果 没 有 指定 IPC NOWAIT, 
则 进程 会 一 直 阻 塞 到 : 有 空间 可 以 容纳 要 发 送 的 消息 ; 或 者 从 系统 中 删除 了 此 队列 ; 或 者 捕捉 到 
一 个 信号 ， 并 从 信号 处 理 程序 返回 。 在 第 二 种 情况 下 ， 会 返回 EIDRM 错误 (“标识 符 被 删除 ”)。 
最 后 一 种 情况 则 返回 EINTR 错误 。 563 
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注意 ， 对 删除 消息 队列 的 处 理 不 是 很 完善 。 因 为 每 个 消息 队列 没有 维护 引用 计数 器 〈 打 开 文 
件 有 这 种 计数 器 )， 所 以 在 队列 被 删除 以 后 ， 仍 在 使 用 这 一 队列 的 进程 在 下 次 对 队列 进行 操作 时 
会 出 错 返 回 。 信 和 号 量 机 构 也 以 同样 方式 处 理 其 删除 。 相 反 ， 删 除 一 个 文件 时 ， 要 等 到 使 用 该 文件 
的 最 后 一 个 进程 关闭 了 它 的 文件 描述 符 以 后 ， 才 能 删除 文件 中 的 内 容 。 

当 msgsnd 返回 成 功 时 ， 消 息 队 列 相 关 的 msqid_ds 结构 会 随 之 更 新 ， 表 明 调用 的 进程 ID 
Cmsg_1spid)、 调 用 的 时 间 (msg stime) 以 及 队列 中 新 增 的 消息 (msg_qnum)。 

msgrcv 从 队列 中 取 用 消息 。 


#include <sys/msg.h> 
ssize_t msgrcv(int msgid, void *ptr, size t nbytes, long type, int flag); 
返回 值 : 若 成 功 ， 返 回 消息 数据 部 分 的 长 度 ;， 若 出 错 ， 返 回 -1 


和 msgsnd 一 样 ，ptr 参数 指向 一 个 长 整 型 数 〈 其 中 存储 的 是 返回 的 消息 类 型 )， 其 后 跟随 的 
是 存储 实际 消息 数据 的 缓冲 区 。nbytes 指定 数据 缓冲 区 的 长 度 。 若 返回 的 消息 长 度 大 于 nbytes, 
而 且 在 ffag 中 设置 了 MSG_NOERROR 位 ， 则 该 消息 会 被 截断 〈 在 这 种 情况 下 ， 没 有 通知 告诉 我 们 
消息 截断 了 ， 消 息 被 截 去 的 部 分 被 丢弃 )。 如 果 没 有 设置 这 一 标志 ， 而 消息 又 太 长 ， 则 出 错 返 回 
E2BIG《〈 消 息 仍 留 在 队列 中 )。 

参数 type 可 以 指定 想 要 哪 一 种 消息 。 

type = 0 返回 队列 中 的 第 一 个 消息 。 

type>0 返回 队列 中 消息 类 型 为 type 的 第 一 个 消息 。 

bpe<0 返回 队列 中 消息 类 型 值 小 于 等 于 ope 绝对 值 的 消息 ， 如 果 这 种 消息 有 若干 个 ， 则 

取 类 型 值 最 小 的 消息 。 

type 值 非 0 用 于 以 非 先 进 先 出 次 序 读 消息 。 例 如 ， 若 应 用 程序 对 消息 赋予 优先 权 ， 那 么 type 
就 可 以 是 优先 权 值 。 如 果 一 个 消息 队列 由 多 个 客户 进程 和 一 个 服务 器 进程 使 用 ， 那 么 type 字段 可 
以 用 来 包含 客户 进程 的 进程 ID 〈 只 要 进程 ID 可 以 存放 在 长 整 型 中 )。 

可 以 将 flag 值 指定 为 TPC_NOWAIT， 使 操作 不 阻塞 这样， 如果 没有 所 指定 类 型 的 消息 可 用 ， 
则 msgrcv 返回 -1，error 设置 为 ENOMSG。 如 果 没 有 指定 IPC_NOWAIT， 则 进程 会 一 直 阻 塞 
到 有 了 指定 类 型 的 消息 可 用 ,或 者 从 系统 中 删除 了 此 队列 (返回 一 1，error 设置 为 EIDRM), 或 
者 捕捉 到 一 个 信号 并 从 信号 处 理 程序 返回 (这 会 导致 msgrcv 返回 一 1，errno 设置 为 EINTR)。 

msgrcv 成 功 执行 时 ,内 核 会 更 新 与 该 消息 队列 相关 联 的 msgid_qs 结构 ,以 指示 调用 者 的 进程 
ID (msg_lrpid) 和 调用 时 间 (msg_rtime)， 并 指示 队列 中 的 消息 数 减 少 了 1 个 (sg qnum. 











加 实例 : 消息 队列 与 全 双 工 管道 的 时 间 比 较 


如 若 需要 客户 进程 和 服务 器 进程 之 间 的 双向 数据 流 ， 可 以 使 用 消息 队列 或 全 双 工 管道 。( 回 
忆 图 15-1, 通过 UNIX 域 套 接 字 机 制 , 见 17.2 节 , 可 以 使 全 双 工 管道 可 用 , 而 某 些 平台 通过 pipe 
函数 提供 全 双 工 管道 。) 

图 15-27 显示 了 在 Solaris 上 3 种 技术 在 时 间 方 面 的 比较 ， 这 3 种 技术 是 : 消息 队列 、 全 双 工 
(STREAMS) 管道 和 UNIX 域 套 接 字 。 测 试 程序 先 创 建 IPC 通道 ， 调 用 fork， 然 后 从 父 进程 向 
子 进程 发 送 约 200MB 数据 。 数 据 发 送 的 方式 是 : 对 于 消息 队列 ， 调 用 100 000 次 msgshd， 每 个 
消息 长 度 为 2 000 字 节 ; 对 于 全 双 工 管道 和 UNIX 域 套 接 字 ， 调 用 100 000 次 write, 每 次 写 2 000 
字 节 。 时 间 都 以 秒 为 单位 。 
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消息 队列 0.58 4.16 5.09 
全 双 工 管道 0.61 4.30 5.24 
UNIX 域 套 接 字 0.59 5.58 7.49 


图 15-27 在 Solaris 上 3 种 IPC 的 时 间 比 较 


从 这 些 数字 中 可 见 ， 消 息 队 列 原来 的 实施 目的 是 提供 高 于 一 般 速 度 的 了 了 C， 但 现在 与 其 他 形 
式 的 IPC 相 比 ， 在 速度 方面 已 经 没有 什么 差别 了 。 (在 原来 实施 消息 队列 时 ， 可 用 的 其 他 形式 的 
IPC 就 只 有 半 双 工 管道 这 一 种 。) 考虑 到 使 用 消息 队列 时 遇 到 的 问题 〈 见 15.6.4 节 )， 我 们 得 出 的 
结论 是 ， 在 新 的 应 用 程序 中 不 应 当 再 使 用 它们 。 - E 
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信号 量 与 已 经 介绍 过 的 IPC 机 构 ( 管 道 、FIFO 以 及 消息 列队 ) 不 同 。 它 是 一 个 计数 器 ， 用 
于 为 多 个 进程 提供 对 共享 数据 对 象 的 访问 。 
Single UNIX Specification 包括 了 另外 一 套 信号 量 接口 ， 该 接口 原来 是 实时 扩展 的 一 部 分 。 我 
们 将 在 15.10 节 讨 论 这 种 接口 。 


为 了 获得 共享 资源 ， 进 程 需要 执行 下 列 操作 。 

(1) 测试 控制 该 资源 的 信号 量 。 

(2) 若 此 信号 量 的 值 为 正 ， 则 进程 可 以 使 用 该 资源 。 在 这 种 情况 下 ， 进 程 会 将 信号 量 值 减 1， 
表示 它 使 用 了 一 个 资源 单位 。 

(3) 否则 ， 考 此 信和 号 量 的 值 为 0， 则 进程 进入 休眠 状态 ， 直 至 信号 量 值 大 于 0。 进 程 被 唤醒 
后 ， 它 返回 至 步骤 CDD. 

当 进程 不 再 使 用 由 一 个 信号 量 控 制 的 共享 资源 时 ， 该 信号 量 值 增 1。 如 果 有 进程 正在 休眠 等 
待 此 信号 量 ， 则 唤醒 它们 。 

为 了 正确 地 实现 信号 量 ， 信 和 号 量 值 的 测试 及 减 1 操作 应 当 是 原子 操作 。 为 此 ， 信 号 量 通 常 是 
在 内 核 中 实现 的 。 

常用 的 信和 号 量 形式 被 称 为 二 元 信号 量 (binary semaphore)。 它 控制 单个 资源 ， 其 初始 值 为 1。 但 
是 ， 一 般 而 言 ， 信 号 量 的 初 值 可 以 是 任意 一 个 正 值 ， 该 值 表明 有 多 少 个 共享 资源 单位 可 供 共享 应 用 。 

遗憾 的 是 ，XSI 信号 量 与 此 相 比 要 复杂 得 多 。 以 下 3 种 特性 造成 了 这 种 不 必要 的 复杂 性 。 

(1) 信号 量 并 非 是 单个 非 负 值 ， 而 必需 定义 为 含有 一 个 或 多 个 信和 号 量 值 的 集合 。 当 创建 信和 号 
量 时 ， 要 指定 集合 中 信和 号 量 值 的 数量 。 

(2) 信号 量 的 创建 (semget) 是 独立 于 它 的 初始 化 (semct1) 的 。 这 是 一 个 致命 的 缺点 ， 
因为 不 能 原子 地 创建 一 个 信号 量 集合 ， 并 且 对 该 集合 中 的 各 个 信号 量 值 赋 初 值 。 

(3) 即使 没有 进程 正在 使 用 各 种 形式 的 XSI IPC， 它 们 仍然 是 存在 的 。 有 的 程序 在 终止 时 并 
没有 释放 已 经 分 配给 它 的 信号 量 ， 所 以 我 们 不 得 不 为 这 种 程序 担心 。 后 面 将 要 说 明 的 undo 功能 
就 是 处 理 这 种 情况 的 。 

内 核 为 每 个 信号 量 集合 维护 着 一 个 semid_ds 结构 : 


struct semid_ds { 
struct ipc_perm sem_perm; /* see Section 15.6.2 */ 











456 第 15 章 进程 间 通 信 


unsigned short sem nsems; /* # of semaphores in set */ 
time_t sem_otime; /* last-semop() time */ 
time_t sem ctime;  /* last-change time */ 


he 

Single UNIX Specification 定义 了 上 面 所 示 的 各 字段 ， 但 是 具体 实现 可 在 semid_ds 结构 中 定 
义 添 加 的 成 员 。 

每 个 信号 量 由 一 个 无 名 结构 表示 ， 它 人 至少 包含 下 列 成 员 : 


struct { 
unsigned short semval; /* semaphore value, always >= 0 */ 
pid_t sempid; /* pid for last operation */ 
unsigned short semncnt; /* # processes awaiting semval>curval */ 
unsigned short semzcnt; /* # processes awaiting semval==0 */ 


hi 
图 15-28 列 出 了 影响 信号 量 集合 的 系统 限制 。 


典型 值 


FreeBSD 8.0 Linux 3.2.0 Mac OS X 10. 6.8 | Solaris 10 | 


任 一 信号 量 的 最 大 值 

任 一 信号 量 的 最 大 退出 时 的 调整 值 
系统 中 信号 量 集 的 最 大 数量 

系统 中 信号 量 的 最 大 数量 

每 个 信号 量 集中 的 信号 量 的 最 大 数量 
系统 中 undo 结构 的 最 大 数量 

每 个 undo 结构 中 undo 项 的 最 大 数量 
每 个 semop 调用 中 操作 的 最 大 数量 


图 15-28 ”影响 信号 量 的 系统 限制 
当 我 们 想 使 用 XSI 信和 号 量 时 ， 首 先 需要 通过 调用 函数 semget 来 获得 一 个 信号 量 ID. 


#include <sys/sem.h> 





int semget(key t key, int nsems, int flag); 


返回 值 : 若 成 功 ， 返 回信 号 量 ID; 若 出 错 ， 返 回 一 1 

15.6.1 节 说 明了 将 key 变换 为 标识 符 的 规则 ,讨论 了 是 创建 一 个 新 集合 , 还 是 引用 一 个 现 有 集合 。 
创建 一 个 新 集合 时 ， 要 对 semid_ds 结构 的 下 列 成 员 赋 初 值 。 

e 按 15.6.2 节 中 所 述 ， 初 始 化 ipc_perm 结构 。 该 结构 中 的 mode 成 员 被 设置 为 flag 中 的 

相应 权限 位 。 这 些 权限 是 用 图 15-24 中 的 值 设置 的 。 

e sem otime 设置 为 0。 

e sem ctime 设置 为 当前 时 间 。 

e sem nsems 设置 为 nsems。 

nsems 是 该 集合 中 的 信号 量 数 。 如 果 是 创建 新 集合 (一 般 在 服务 器 进程 中 )， 则 必须 指定 nsems。 
如 果 是 引用 现 有 集合 〈 一 个 客户 进程 )， 则 将 nsems 指定 为 0。 

semctl 函数 包含 了 多 种 信号 量 操作 。 
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#include <sys/sem.h> 


int semctl(int semid, int semnum, int cmd, ... /* union semun arg */); 





第 4 个 参数 是 可 选 的 ， 是 否 使 用 取决 于 所 请 求 的 命令 ， 如 果 使 用 该 参数 ， 则 其 类 型 是 semun, 
它 是 多 个 命令 特定 参数 的 联合 (union): 
SE adds val; /* for SETVAL */ 
struct semid ds *buf; /* for IPC STAT and IPC SET */ 
unsigned short *array; /* for GETALL and SETALL */ 
}; 
注意 ， 这 个 选项 参数 是 一 个 联合 ， 而 非 指 向 联合 的 指针 。 
通常 应 用 程序 必须 定义 semun 联合 。 然 而 ， 在 FreeBSD 8.0 中 ，semun 已 经 由 <sys/sem.h> 
为 我 们 定义 好 了 。 
cmd 参数 指定 下 列 10 种 命令 中 的 一 种 ， 这 些 命令 是 运行 在 semid 指定 的 信号 量 集合 上 的 。 其 
中 有 5 种 命令 是 针对 一 个 特定 的 信号 量 值 的 ， 它 们 用 semnum 指定 该 信号 量 集 合 中 的 一 个 成 员 。semnum 
值 在 0 和 nsems 一 1 之 间 ， 包 括 0 和 nsems—1. 
IPC_STAT ”对 此 集合 取 semid_ds 结构 ， 并 存储 在 由 arg. buf 指向 的 结构 中 。 
IPC_SET 按 arg.buf 指向 的 结构 中 的 值 ， 设 置 与 此 集合 相关 的 结构 中 的 sem perm.uid. 
sem perm.gid 和 sem_perm.mode 字段 。 此 命令 只 能 由 两 种 进程 执行 : 一 
种 是 其 有 效用 户 ID 等 于 sem perm.cuid £& sem perm.uid 的 进程 ， 另 一 
种 是 具有 超级 用 户 特 权 的 进程 。 
IPC RMID ”从 系统 中 删除 该 信号 量 集合 。 这 种 删除 是 立即 发 生 的 。 删 除 时 仍 在 使 用 此 信 
号 量 集 合 的 其 他 进程 ， 在 它们 下 次 试图 对 此 信号 量 集合 进行 操作 时 ， 将 出 错 
返回 EIDRM。 此 命令 只 能 由 两 种 进程 执行 : 一 种 是 其 有 效用 户 ID 等 于 sem 
perm.cuid 或 sem_perm.uid 的 进程 ; 另 一 种 是 具有 超级 用 户 特 权 的 进程 。 


GETVAL 返回 成 员 semnum 的 semval 值 。 
SETVAL 设置 成 员 semnum 的 semval 值 。 该 值 由 arg.val 指定 。 
GETPID 返回 成 员 semnum 的 sempid 值 。 


GETNCNT 返回 成 员 semnum 的 semncnt 值 。 

GETZCNT 返回 成 员 semnum 的 semzcnt 值 。 

GETALL 取 该 集合 中 所 有 的 信号 量 值 。 这 些 值 存储 在 arg.array 指向 的 数组 中 。 

SETALL 将 该 集合 中 所 有 的 信号 量 值 设 置 成 arg.array 指向 的 数组 中 的 值 。 

对 于 除 GETALL 以 外 的 所 有 GET 命令 ，semct1 函数 都 返回 相应 值 。 对 于 其 他 命令 ， 若 成 功 
则 返回 值 为 0， 若 出 错 ， 则 设置 errno 并 返回 -1。 

函数 semop 自动 执行 信号 量 集合 上 的 操作 数组 。 


#include <sys/sem.h> 





int semop (int semid, struct sembuf semoparray|], size t nops); 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 
参数 semoparray 是 一 个 指针 ， 它 指向 一 个 由 sembuf 结构 表示 的 信号 量 操 作 数 组 : 
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struct sembuf { 


unsigned short sem_num; /* member # in set (0, 1, ..., nsems-1 */ 
short sem_op; /* operation(negative, 0,or pasitive */) 
short sem_flg; /* IPC_NOWAIT, SEM_UNDO */ 


he 
参数 nops 规定 该 数组 中 操作 的 数量 〈 元 素数 )。 
对 集合 中 每 个 成 员 的 操作 由 相应 的 sem_op 值 规定 。 此 值 可 以 是 负 值 、0 或 正 值 。( 下 面 的 讨 
论 将 提 到 信号 量 的 “undo” 标 志 。 此 标志 对 应 于 相应 的 sem £1g 成 员 的 SEM UNDO 位 。) 
CD 最 易于 处 理 的 情况 是 sem op 为 正 值 。 这 对 应 于 进程 释放 的 占用 的 资源 数 。sem_op fi 
会 加 到 信和 号 量 的 值 上 。 如 果 指 定 了 undo 标志 ， 则 也 从 该 进程 的 此 信和 号 量 调整 值 中 减 去 sem op. 
(2) 4$ sem op 为 负 值 ， 则 表示 要 获取 由 该 信号 量 控制 的 资源 。 
如 若 该 信号 量 的 值 大 于 等 于 sem op 的 绝对 值 (具有 所 需 的 资源 )， 则 从 信和 号 量 值 中 减 去 sem op 
的 绝对 值 。 这 能 保证 信号 量 的 结果 值 大 于 等 于 0。 如 果 指 定 了 undo 标志 ， 则 sem op 的 绝对 值 也 
加 到 该 进程 的 此 信号 量 调整 值 上 。 
如 果 信 号 量 值 小 于 sem op 的 绝对 值 (资源 不 能 满足 要 求 )， 则 适用 下 列 条 件 。 
a. 474832 T IPC NOWAIT, Jl] semop 出 错 返 回 EAGAIN。 
b. 47 ATR IPC_NOWAIT， 则 该 信号 量 的 semncnt 值 加 1〈 因 为 调用 进程 将 进入 休眠 状 
态 )， 然 后 调用 进程 被 挂 起 直至 下 列 事件 之 一 发 生 。 
i. 此 信号 量 值 变 成 大 于 等 于 sem op 的 绝对 值 ( 即 某 个 进程 已 释放 了 某 些 资源 )。 此 信号 
HHJ semncnt 值 减 1 (因为 已 结束 等 待 )， 并 且 从 信号 量 值 中 减 去 sem op 的 绝对 值 。 
如 果 指 定 了 undo 标志 ， 则 sem_op 的 绝对 值 也 加 到 该 进程 的 此 信号 量 调整 值 上 。 
ii 从 系统 中 删除 了 此 信号 量 。 在 这 种 情况 下 ， 函 数 出 错 返回 EIDRM。 
ii. 进程 捕捉 到 一 个 信号 , 并 从 信号 处 理 程序 返回 , 在 这 种 情况 下 ,此 信和 号 量 的 semncnt 
值 减 1 (因为 调用 进程 不 再 等 待 )， 并 且 函 数 出 错 返 回 EINTR。 
(3) #7 sem op 为 0， 这 表示 调用 进程 希望 等 待 到 该 信号 量 值 变 成 0。 
如 果 信 号 量 值 当前 是 0， 则 此 函数 立即 返回 。 
如 果 信 号 量 值 非 0， 则 适用 下 列 条 件 。 
a. 若 指定 了 IPC_NOWRAIT， 则 出 错 返回 EAGAIN. 
b. 若 未 指定 IPC_NOWAIT， 则 该 信号 量 的 semzcnt 值 加 1〔〈 因 为 调用 进程 将 进入 休眠 状 
态 )， 然 后 调用 进程 被 挂 起 ， 直 至 下 列 的 一 个 事件 发 生 。 
i， 此 信号 量 值 变 成 0。 此 信和 号 量 的 semzent 值 减 1 (因为 调用 进程 已 结束 等 待 )。 
ii， 从 系统 中 删除 了 此 信和 号 量 。 在 这 种 情况 下 ， 函 数 出 错 返回 EIDRM。 
ii. 进程 捕捉 到 一 个 信号 , 并 从 信和 号 处 理 程序 返回 。 在 这 种 情况 下 , 此 信号 量 的 semzcnt 
值 减 1 (因为 调用 进程 不 再 等 待 )， 并 且 函 数 出 错 返 回 EINTR. 
semop 函数 具有 原子 性 ， 它 或 者 执行 数组 中 的 所 有 操作 ， 或 者 一 个 也 不 做 。 
exit 时 的 信号 量 调整 
正如 前 面 提 到 的 ， 如 果 在 进程 终止 时 ， 它 占用 了 经 由 信号 量 分 配 的 资源 ， 那 么 就 会 成 为 一 个 
问题 。 无 论 何 时 只 要 为 信号 量 操作 指定 了 SEM UNDO 标志 ， 然 后 分 配 资源 (sem_op 值 小 于 0), 
那么 内 核 就 会 记 住 对 于 该 特定 信号 量 ,， 分 配给 调用 进程 多 少 资源 (sem_op 的 绝对 值 )。 当 该 进程 
终止 时 ， 不 论 自愿 或 者 不 自愿 ， 内 核 都 将 检验 该 进程 是 否 还 有 尚未 处 理 的 信号 量 调整 值 ， 如 果 有 ， 
则 按 调整 值 对 相应 信号 量 值 进行 处 理 。 
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如 果 用 带 SETVAL 或 SETALL 命令 的 semctl 设置 一 个 信号 量 的 值 ， 则 在 所 有 进程 中 , 该 信 
号 量 的 调整 值 都 将 设置 为 0。 


el: 信号 量 、 记 录 锁 和 互 斥 量 的 时 间 比 较 


如 果 在 多 个 进程 间 共 享 一 个 资源 ， 则 可 使 用 这 3 种 技术 中 的 一 种 来 协调 访问 。 我 们 可 以 使 用 
映射 到 两 个 进程 地 址 空间 中 的 信号 量 、 记 录 锁 或 者 互 斥 量 。 对 这 3 种 技术 两 两 之 间 在 时 间 上 的 差 
别 进行 比较 是 有 益 的 。 

若 使 用 信号 量 ， 则 先 创 建 一 个 包含 一 个 成 员 的 信号 量 集合 ， 然 后 将 该 信号 量 值 初始 化 为 1。 
为 了 分 配 资源 ， 以 sem op 为 一 1 调用 semop。 为 了 释放 资源 ， 以 sem op 为 +1 调用 semop。 对 
每 个 操作 都 指定 SEM_UNDO， 以 处 理 在 未 释放 资源 条 件 下 进程 终止 的 情况 。 

车 使 用 记录 锁 ， 则 先 创 建 一 个 空 文件 ， 并 且 用 该 文件 的 第 一 个 字 节 (无 需 存 在 ) 作为 锁 字 节 。 [570] 
为 了 分 配 资源 ， 先 对 该 字 节 获得 一 个 写 锁 。 释 放 该 资源 时 ， 则 对 该 字 节 解锁 。 记 录 锁 的 性 质 确保 
了 当 一 个 锁 的 持 有 者 进程 终止 时 ， 内 核 会 自动 释放 该 锁 。 

若 使 用 互 斥 量 ， 需 要 所 有 的 进程 将 相同 的 文件 映射 到 它们 的 地 址 空间 里 ， 并 且 使 用 PTHREAD_ 
PROCESS SHARED 互 斥 量 属性 在 文件 的 相同 偏 移 处 初始 化 互 斥 量 。 为 了 分 配 资源 ， 我 们 对 互 斥 量 加 
锁 。 为 了 释放 锁 ， 我 们 解锁 互 斥 量 。 如 果 一 个 进程 没有 释放 互 斥 量 而 终止 ， 恢 复 将 是 非常 困难 的 ， 除 
非 我 们 使 用 鲁 棒 互 斥 量 〈 回 忆 12.4.1 节 中 讨论 的 pthreaqd_mutex_consistent MRO. 

图 15-29 显示 了 在 Linux 上 ， 使 用 这 3 种 不 同 技术 进行 锁 操 作 所 需 的 时 间 。 在 每 一 种 情况 下 ， 
资源 都 被 分 配 、 释 放 1 000 000 次 。 这 同时 由 3 个 不 同 的 进程 执行 。 图 15-29 中 所 示 的 时 间 是 3 个 
进程 的 总 计 ， 单 位 是 秒 。 


带 undo 的 信号 量 0.50 6.08 

建议 性 记录 锁 0.51 9.06 

共享 存储 中 的 互 斥 量 0.21 0.40 

图 15-29 Linux 上 锁 替代 技术 的 时 间 比 较 

在 Linux 上 ,记录 锁 比 信号 量 快 , 但 是 共享 存储 中 的 互 斥 量 的 性 能 比 信 号 量 和 记录 锁 的 都 要 优越 。 
如 果 我 们 能 单一 资源 加 锁 ， 并 且 不 需要 XSI 信号 量 的 所 有 花哨 功能 ， 那 么 记录 锁 将 比 信 号 量 要 好 。 原 
因 是 它 使 用 起 来 更 简单 、 速 度 更 快 《 在 这 个 平台 上 )， 当 进程 终止 时 系统 会 管理 遗留 下 来 的 锁 。 尽 管 对 
于 这 种 平台 来 说 ， 在 共享 存储 中 使 用 互 斥 量 是 一 个 更 快 的 选择 ， 但 是 我 们 依然 喜欢 使 用 记录 锁 ， 除 非 
要 特别 考虑 性 能 。 这 样 做 有 两 个 原因 。 首 先 ， 在 多 个 进程 间 共 享 的 内 存 中 使 用 互 斥 量 来 恢复 一 个 终止 
的 进程 更 难 。 其 次 ， 进 程 共享 的 互 斥 量 属性 还 没有 得 到 普遍 支持 。 在 Single UNIX Specification 的 老 版 
本 中 ， 这 是 可 选 的 。 尽 管 在 SUSv4 中 依然 是 可 选 的 ， 但 是 现在 ， 所 有 遵循 XSI 的 实现 都 要 求 使 用 它 。 


在 本 书 讨论 的 4 个 平台 中 ， 只 有 Linux 3.2.0 和 Solaris 10 当前 支持 进程 共享 的 互 斥 量 属性 。 国 
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共享 存储 允许 两 个 或 多 个 进程 共享 一 个 给 定 的 存储 区 。 因 为 数据 不 需要 在 客户 进程 和 服务 器 
进程 之 间 复 制 ， 所 以 这 是 最 快 的 一 种 IPPC。 使 用 共享 存储 时 要 掌握 的 唯一 容 门 是 ， 在 多 个 进程 之 
间 同 步 访问 一 个 给 定 的 存储 区 。 若 服务 器 进程 正在 将 数据 放 入 共享 存储 区 ， 则 在 它 做 完 这 一 操作 
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之 前 ， 客 户 进程 不 应 当 去 取 这 些 数据 。 通 常 ， 信 号 量 用 于 同步 共享 存储 访问 。( 不 过 正如 前 节 最 
后 部 分 所 述 ， 也 可 以 用 记录 锁 或 互 斥 量 。) 
| Single UNIX Specification 在 其 共享 存储 对 象 选项 中 包括 了 访问 共享 存储 的 替代 接口 ， 这 些 接 
| 口 源 于 实时 扩展 。 本 书 不 讨论 这 此 接口 。 
我 们 已 经 看 到 了 共享 存储 的 一 种 形式 ， 就 是 在 多 个 进程 将 同一 个 文件 映射 到 它们 的 地 址 空间 
的 时 候 。XSI 共享 存储 和 内 存 映射 的 文件 的 不 同 之 处 在 于 ， 前 者 没有 相关 的 文件 。XSI 共享 存储 
段 是 内 存 的 匿名 段 。 
内 核 为 每 个 共享 存储 段 维护 着 一 个 结构 ， 该 结构 至 少 要 为 每 个 共享 存储 段 包 含 以 下 成 员 : 


struct shmid ds { 


struct ipc perm shm perm; /* see Section 15.6.2 */ 

size_t shm_segsz; /* size of segment in bytes */ 
pid_t shm_lpid; /* pid of last shmop() */ 

pid_t shm_cpid; /* pid of creator */ 

shmatt_t shm_nattch; /* number of current attaches */ 
time_t shm_atime; /* last-attach time */ 

time_t shm_dtime; /* last-detach time */ 


time_t shm_ctime; /* last-change time */ 
E i 
(按照 支持 共享 存储 段 的 需要 ， 每 种 实现 会 增加 其 他 结构 成 员 。) 


shmatt t 类 型 定义 为 无 符号 整 型 ， 它 至 少 与 unsigned short 一 样 大 。 图 15-30 列 出 了 影 
响 共 享 存储 的 系统 限制 。 


典型 值 
FreeBSD 8.0 | Linux3.2.0 | MacOSX10.6.8 | Solaris 10 | 





共享 存储 段 的 最 大 字 节 长 度 33 554 432 4 194 304 导出 的 
共享 存储 段 的 最 小 字 节 长 度 1 1 1 
系统 中 共享 存储 段 的 最 大 段 数 192 32 128 
每 个 进程 共享 存储 段 的 最 大 段 数 128 8 128 


图 15-30 ”影响 共享 存储 的 系统 限制 
调用 的 第 一 个 函数 通常 是 shmget， 它 获得 一 个 共享 存储 标识 各 


#include <sys/shm.h> 


int shmget (key_t key, size_t size, int flag); 





返回 值 : 若 成 功 ， 返 回 共享 存储 ID;， 若 出 错 ， 返 回 -1 


15.6.1 节 说 明了 将 key 变换 成 一 个 标识 符 的 规则 ， 以 及 是 创建 一 个 新 共享 存储 段 ， 还 是 引用 
一 个 现 有 的 共享 存储 段 。 当 创建 一 个 新 段 时 ， 初 始 化 shmid_ds 结构 的 下 列 成 员 。 
e ipc perm 结构 按 15.6.2 节 中 所 述 进行 初始 化 。 该 结构 中 的 mode 按 flag 中 的 相应 权限 位 
设置 。 这 些 权限 用 图 15-24 中 的 值 指定 。 
e shm lpid、shm nattach、shm atime 和 shm_dtime 都 设置 为 0。 
e shm ctime 设置 为 当前 时 间 。 
e shm segsz 设置 为 请 求 的 size. 
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参数 size 是 该 共享 存储 段 的 长 度 , 以 字 节 为 单位 。 实现 通常 将 其 向 上 取 为 系统 页 长 的 整 倍数 。 
但 是 ， 若 应 用 指定 的 size 值 并 非 系 统 页 长 的 整 倍 数 ， 那 么 最 后 一 页 的 余下 部 分 是 不 可 使 用 的 。 如 
果 正 在 创建 一 个 新 段 ( 通 常 在 服务 器 进程 中 ), 则 必须 指定 其 size。 如 果 正 在 引用 一 个 现存 的 段 (一 
个 客户 进程 )， 则 将 size 指定 为 0。 当 创建 一 个 新 段 时 ， 段 内 的 内 容 初始 化 为 0。 

shmctl 函数 对 共享 存储 段 执行 多 种 操作 。 


#include <sys/shm.h> 


int shmctl(int shmid, int cmd, struct shmid_ds *buf); 





返回 值 : 车 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1! 


cmd 参数 指定 下 列 5 种 命令 中 的 一 种 ， 使 其 在 shmid 指定 的 段 上 执行 。 

IPC STAT JUKE shmid_ds 结构 ， 并 将 它 存储 在 由 buf 指 向 的 结构 中 。 

IPC_SET 按 buf 指向 的 结构 中 的 值 设 置 与 此 共享 存储 段 相关 的 shmid_ds 结构 中 的 下 
列 3 FA: shm perm.uid. shm perm.gid Ñl shm perm.mode。 此 命 
令 只 能 由 下 列 两 种 进程 执行 : 一 种 是 其 有 效用 户 ID 等 于 shm perm.cuid E 
shm perm.uid 的 进程 ， 另 一 种 是 具有 超级 用 户 特权 的 进程 。 

IPC RMID ”从 系统 中 删除 该 共享 存储 段 。 因 为 每 个 共享 存储 段 维护 着 一 个 连接 计数 
(shmid_ds 结构 中 的 shm_nattch 字段 )， 所 以 除非 使 用 该 段 的 最 后 一 个 进 
程 终 止 或 与 该 段 分 离 ， 否 则 不 会 实际 上 删除 该 存储 段 。 不 管 此 段 是 否 仍 在 使 
用 ， 该 段 标 识 符 都 会 被 立即 删除 ， 所 以 不 能 再 用 shmat 与 该 段 连接 。 此 命令 
只 能 由 下 列 两 种 进程 执行 : 一 种 是 其 有 效用 户 ID 等 于 shm perm.cuid £X 
shm perm.uid 的 进程 ， 另 一 种 是 具有 超级 用 户 特权 的 进程 。 

Linux 和 Solaris 提供 了 另外 两 种 命令 ， 但 它们 并 非 Single UNIX Specification 的 组 成 部 分 。 

SHM_LOCK 在 内 存 中 对 共享 存储 段 加 锁 。 此 命令 只 能 由 超级 用 户 执行 。 

SHM UNLOCK ”解锁 共享 存储 段 。 此 命令 只 能 由 超级 用 户 执行 。 

一 旦 创建 了 一 个 共享 存储 段 ， 进 程 就 可 调用 shmat 将 其 连接 到 它 的 地 址 空间 中 。 


#include <sys/shm.h> 


void *shmat (int shmid, const void *addr, int flag); 


返回 值 ， 若 成 功 ， 返 回 指向 共享 存储 段 的 指针 ; 若 出 错 ， 返 回 -1 





共享 存储 段 连接 到 调用 进程 的 哪个 地 址 上 与 addr 参数 以 及 flag 中 是 否 指定 SHM_RND 位 有 关 。 
。 如 果 addr 为 0， 则 此 段 连接 到 由 内 核 选 择 的 第 一 个 可 用 地 址 上 。 这 是 推荐 的 使 用 方式 。 
e 如 果 addr 非 0， 并 且 没有 指定 SHM_RND， 则 此 段 连接 到 addr 所 指定 的 地 址 上 。 
。 WẸ addr 非 0， 并 且 指 定 了 SHM_RND， 则 此 段 连 接 到 Caddr—(addr mod SHMLBA)) 所 
表示 的 地 址 上 。SHM_RND 命令 的 意思 是 “ 取 整 "”” SHMLBA 的 意思 是 “ 低 边 界 地 址 倍数 ”， 
它 总 是 2 的 乘 方 。 该 算式 是 将 地 址 向 下 取 最 近 1 个 SHMLBA 的 倍数 。 
除非 只 计划 在 一 种 硬件 上 运行 应 用 程序 (这 在 当今 是 不 大 可 能 的 )， 否 则 不 应 指定 共享 存储 
段 所 连接 到 的 地 址 。 而 是 应 当 指 定 addr 为 0，， 以 便 由 系统 选择 地 址 。 
如 果 在 flag 中 指定 了 SHM RDONLY 位 ， 则 以 只 读 方式 连接 此 段 ， 否 则 以 读 写 方式 连接 此 段 。 
shmat 的 返回 值 是 该 段 所 连接 的 实际 地 址 ， 如 果 出 错 则 返回 一 1。 如 果 shmat 成 功 执 行 ， 那 
么 内 核 将 使 与 该 共享 存储 段 相 关 的 shmid_ds 结构 中 的 shm_nattch 计数 器 值 加 1。 
当 对 共享 存储 段 的 操作 已 经 结束 时 ， 则 调用 shmdt 与 该 段 分离 。 注 意 ， 这 并 不 从 系统 中 删除 
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其 标识 符 以 及 其 相关 的 数据 结构 。 该 标识 符 仍然 存在 ， 直 至 某 个 进程 (一般 是 服务 器 进程 》 带 
IPC RMID 命令 的 调用 shmct1 特地 删除 它 为 止 。 
#include <sys/shm.h> 


int shmdt(const void *addr) ; 


返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 


addr 参数 是 以 前 调用 shmat 时 的 返回 值 。 如 果 成 功 ，shmdt 将 使 相关 shmid_ds 结构 中 的 
shm_nattch 计数 器 值 减 1。 





实例 
内 核 将 以 地 址 0 连接 的 共享 存储 段 放 在 什么 位 置 上 与 系统 密切 相关 。 图 15-31 中 的 程序 打印 
了 一 些 特 定 系统 存放 各 种 类 型 的 数据 的 位 置信 息 。 


#include "apue.h" 
#include <sys/shm.h> 


#define ARRAY SIZE 40000 
#define MALLOC_SIZE 100000 


#define SHM_SIZE 100000 

#define SHM MODE 0600/* user read/write */ 
chararray[ARRAY SIZE]; /* uninitialized data = bss */ 
int 


main (void) 
{ 
int shmid; 
char *ptr, *shmptr; 


printf ("array[] from %p to %p\n", (void *)&array[0], 
(void *)&array[ARRAY SIZE]); 
printf("stack around %p\n", (void *)&shmid); 


if ((ptr = malloc(MALLOC SIZE)) -- NULL) 
err sys("malloc error"); 
printf("malloced from %p to %p\n", (void *)ptr, 
(void *)ptr-*MALLOC SIZE); 


if ((shmid = shmget(IPC PRIVATE, SHM SIZE, SHM MODE)) < 0) 
err sys("shmget error"); 
if ((shmptr = shmat(shmid, 0, 0)) == (void *)-1) 
err sys("shmat error"); 
printf("shared memory attached from $p to %p\n", (void *)shmptr, 
(void *)shmptr-*SHM SIZE); 


if (shmctl(shmid, IPC RMID, 0) < 0) 
err sys("shmctl error"); 


exit(0); 


15-31 打印 各 种 类 型 的 数据 存放 的 位 置 
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在 一 个 基于 Intel 的 64 位 Linux 系统 上 运行 此 程序 ， 其 输出 如 下 : 


$ ./a.out 

array[] from 0x6020c0 to 0x60bd00 

stack around 0x7fff957b146c 

malloced from 0x9e3010 to 0x9fb6b0 

shared memory attached from 0x7fba578ab000 to 0x7fba578c36a0 


图 15-32 显示 了 这 种 情况 ， 这 与 图 7-6 中 所 示 的 典型 存储 区 布局 类 似 。 注 意 ， 共 享 存 储 段 紧 靠 在 
we. E 
回忆 一 下 mmap 函数 〈( 见 14.8 节 )， 它 可 将 一 个 文件 的 若干 部 分 映射 至 进程 地 址 空间 。 这 在 
概念 上 类 似 于 用 shmat XSI IPC 函数 连接 一 个 共享 存储 段 。 两 者 之 间 的 主要 区 别 是 ， 用 mmap 映 

射 的 存储 段 是 与 文件 相关 联 的 ， 而 XSI 共享 存储 段 则 并 无 这 种 关联 。 


命令 行 参 数 
和 环境 变量 


Ox7fff957b146c 







0x7fba578c36a0 


jio 字 节 的 共享 存储 
0x7£ba578ab000 


0x0000009e3010 
0x00000060bd00 


未 初始 化 的 数据 40,000 字 节 的 array[ ] 


(bss) 


已 初始 化 的 数据 


15-32 ”在 基于 Intel 的 Linux 系统 上 的 存储 区 布局 


0x0000009fb6b0 
100,000 字 节 的 malloc 







0x0000006020c0 


低地 址 


m BI: /dev/zero 的 存储 映射 


共享 存储 可 由 两 个 不 相关 的 进程 使 用 。 但 是 ， 如 果 进 程 是 相关 的 ， 则 某 些 实现 提供 了 一 种 不 
下 面 说 明 的 技术 用 于 FreeBSD 8.0、Linux 3.2.0 和 Solaris 10, Mac OS X 10.6.8 当前 并 不 支持 
将 字符 设备 映射 至 进程 地 址 空间 。 
在 读 设备 /dev/zero 时 ， 该 设备 是 0 字 节 的 无 限 资 源 。 它 也 接收 写 向 它 的 任何 数据 ， 但 
又 忽略 这 些 数据 。 我 们 对 此 设备 作为 IPC 的 兴趣 在 于 ， 当 对 其 进行 存储 映射 时 ， 它 具有 一 些 
特殊 性 质 。 
。 创建 一 个 未 命名 的 存储 区 ， 其 长 度 是 mmap 的 第 二 个 参数 , 将 其 向 上 取 整 为 系统 的 最 近 页 长 。 
。 存储 区 都 初始 化 为 0。 
e 如 果 多 个 进程 的 共同 祖先 进程 对 mmap 指定 了 MAP SHARED 标志 ， 则 这 些 进程 可 共享 此 
存储 区 。 
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图 15-33 中 的 程序 是 使 用 此 特殊 设备 的 一 个 例子 。 


#include "apue.h" 


#include <fcntl.h> 
#include <sys/mman.h> 


#define NLOOPS 1000 
#define SIZE sizeof(long) /* size of shared memory area */ 


static int 
update(long *ptr) 
{ 


return ((*ptr) ++); /* return value before increment */ 


int 
main (void) 


{ 


int fd, i, counter; 
pid_t pid; 
void *area; 


if ((fd = open("/dev/zero", O RDWR)) < 0) 
err_sys ("open error"); 
if ((area = mmap(0, SIZE, PROT_READ | PROT_WRITE, MAP_SHARED, 


fd, 0)) == MAP FAILED) 
err sys("mmap error"); 
close(fd); /* can close /dev/zero now that it's mapped */ 


TELL WAIT (); 


if ((pid » fork()) « 0) ( 
err sys("fork error"); 


} else if (pid > 0) ( /* parent */ 
for (i = 0; i < NLOOPS; i += 2) { 
if ((counter = update((long *)area)) != i) 


err quit("parent: expected $d, got $d", i, counter); 


TELL CHILD (pid); 
WAIT CHILD(); 
) 
j aisé 1 /* child */ 
for (i = 1; i < NLOOPS + 1; i += 2) { 
WAIT PARENT(); 


if ((counter - update((long *)area)) !- i) 
err quit("child: expected %d, got %d", i, counter); 


TELL PARENT (getppid()); 


exit(0); 
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该 程序 打开 此 /dev/zero 设备 ， 然 后 指定 长 整 型 的 长 度 调 用 mmap。 注 意 , 一 旦 存储 区 映射 
成 功 ， 我 们 就 要 关闭 (close) 此 设备 。 然后， 进程 创建 一 个 子 进程 。 因 为 在 调用 mmap 时 指定 
了 MAP_SHARED， 所 以 一 个 进程 写 到 存储 映射 区 的 数据 可 被 男 一 进程 见 到 。( 如 果 已 指定 
MAP_PRIVATE， 则 此 程序 不 能 工作 。) 

然后 ， 父 进程 、 子 进程 交替 运行 ， 它 们 使 用 8.9 节 中 的 同步 函数 各 自 对 共享 存储 映射 区 中 的 
长 整 型 数 加 1。 存 储 映 射 区 由 mmap 初始 化 为 0。 父 进程 先 对 它 进行 增 1 操作 ， 使 其 成 为 1， 然后 
子 进 程 对 其 进行 增 1 操作 ， 使 其 成 为 2， 然后 父 进程 使 其 成 为 3， 依 此 类 推 。 注意 ， 当 在 update 
函数 中 对 长 整 型 值 增 1 时 ， 因 为 增加 的 是 其 值 ， 而 不 是 指针 ， 所 以 必须 使 用 括号 。 

以 上 述 方式 使 用 /dev/zero 的 优点 是 : 在 调用 mmap 创建 映射 区 之 前 ， 无 需 存在 一 个 实际 
文件 。 映 射 /dev/zero 自动 创建 一 个 指定 长 度 的 映射 区 。 这 种 技术 的 缺点 是 : 它 只 在 两 个 相关 
进程 之 间 起 作用 。 但 在 相关 进程 之 间 使 用 线程 可 能 更 为 简单 有 效 《〈 见 第 11 章 和 第 12 章 )。 注意 ， 
无 论 使 用 哪 一 种 技术 ， 都 需 对 共享 数据 进行 同步 访问 。 " 


"a XB: 匿名 存储 映射 


很 多 实现 提供 了 一 种 类 似 于 /dev/zero 的 设施 ， 称 为 匿名 存储 映射 。 为 了 使 用 这 种 功能 ， 要 
在 调用 mmap 时 指定 MAP ANON 标志 ， 并 将 文件 描述 符 指 定 为 一 1。 结 果 得 到 的 区 域 是 匿名 的 〈 因 
为 它 并 不 通过 一 个 文件 描述 符 与 一 个 路 径 名 相 结 合 )， 并且 创建 了 一 个 可 与 后 代 进 程 共 享 的 存储 区 。 
本 书 讨论 的 4 种 平台 都 支持 匿名 存储 映射 设施 。 但 是 注意 ，Linux 为 此 设备 定义 了 MAP_ 
ANONYMOUS 标志 ， 并 将 MAP ANON 标志 定义 为 与 它 相 同 的 值 以 改善 应 用 的 可 移植 性 。 


为 使 图 15-33 中 的 程序 应 用 这 个 设施 ， 我 们 对 它 做 了 3 处 修改 :(a) 删除 了 /dev/zero 的 
open 语句 ，(b) 删除 了 应 的 close 语句 ，(c) 将 mmap 调用 修改 如 下 : 


if ((area = mmap(0, SIZE, PROT_READ | PROT_WRITE, 
MAP ANON | MAP SHARED, -1, 0)) == MAP FAILED) 


此 调用 指定 了 MAP ANON 标志 ， 并 将 文件 描述 符 设置 为 -1。 图 15-33 中 的 程序 的 其 余部 分 没 变 。 

最 后 两 个 实例 说 明了 在 多 个 无 关 进 程 之 间 如 何 使 用 共享 存储 段 。 如 果 在 两 个 无 关 进 程 之 间 要 
使 用 共享 存储 段 ， 那 么 有 两 种 替代 的 方法 。 一 种 是 应 用 程序 使 用 XSI 共享 存储 函数 ， 另 一 种 是 使 
用 mmap 将 同一 文件 映射 至 它们 的 地 址 空间 ， 为 此 使 用 MAP_SHARED 标志 。 


15.10 POSIX 信号 量 


POSIX 信号 量 机 制 是 3 种 IPC 机 制 之 一 , 3 种 IPC 机 制 源 于 POSIX.1 的 实时 扩展 。 Single UNIX 
Specification 将 3 种 机 制 (消息 队列 、 信号 量 和 共享 存储 ) 置 于 可 选 部 分 中 。 在 SUSv4 之 前 , POSIX 
信和 号 量 接口 已 经 被 包含 在 信号 量 选 项 中 。 在 SUSv4 中 ， 这 些 接口 被 移 至 了 基本 规范 ， 而 消息 队列 
和 共享 存储 接口 依然 是 可 选 的 。 

POSIX 信和 号 量 接口 意 在 解决 XSI 信和 号 量 接口 的 几 个 缺陷 。 

e 相 比 于 XSI 接口 ，POSIX 信号 量 接口 考虑 到 了 更 高 性 能 的 实现 。 

e POSIX 信号 量 接 口 使 用 更 简单 :没有 信号 量 集 ， 在 熟悉 的 文件 系统 操作 后 一 些 接 口 被 模 

式 化 了 。 尽 管 没 有 要 求 一 定 要 在 文件 系统 中 实现 ， 但 是 一 些 系统 的 确 是 这 么 实现 的 。 
e POSIX 信和 号 量 在 删除 时 表现 更 完美 。 回 忆 一 下 ， 当 一 个 XSI 信和 号 量 被 删除 时 ， 使 用 这 个 
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信号 量 标识 符 的 操作 会 失败 ， 并 将 errno 设置 成 EIDRM。 使 用 POSIX 信号 量 时 ， 操 作 
能 继续 正常 工作 直到 该 信号 量 的 最 后 一 次 引用 被 释放 。 
POSIX 信号 量 有 两 种 形式 : 命名 的 和 未 命名 的 。 它 们 的 差异 在 于 创建 和 销毁 的 形式 上 ， 但 其 
他 工作 一 样 。 未 命名 信号 量 只 存在 于 内 存 中 ， 并 要 求 能 使 用 信号 量 的 进程 必须 可 以 访问 内 存 。 这 
意味 着 它们 只 能 应 用 在 同一 进程 中 的 线程 ， 或 者 不 同 进程 中 已 经 映射 相同 内 存 内 容 到 它们 的 地 址 
空间 中 的 线程 。 相 反 ， 命 名 信号 量 可 以 通过 名 字 访 问 ， 因 此 可 以 被 任何 已 知 它们 名 字 的 进程 中 的 
线程 使 用 。 
我 们 可 以 调用 sem_open 函数 来 创建 一 个 新 的 命名 信号 量 或 者 使 用 一 个 现 有 信和 号 量 。 


#include <semaphore.h> 


sem t *sem open(const char *mame, int oflag, ... /* mode t mode, 


unsigned int value */ ); 


返回 值 ， 若 成 功 ， 返 回 指向 信号 量 的 指针 ; 若 出 错 ， 返 回 SEM FAILED 





当 使 用 一 个 现 有 的 命名 信和 号 量 时 ， 我 们 仅仅 指定 两 个 参数 : 信号 量 的 名 字 和 oflag 参数 的 0 
值 。 当 这 个 oflag 参数 有 o cREAT 标志 集 时 ， 如 果 命 名 信和 号 量 不 存在 ， 则 创建 一 个 新 的 。 如 果 它 
已 经 存在 ， 则 会 被 使 用 ， 但 是 不 会 有 额外 的 初始 化 发 生 。 
当 我 们 指定 O_CREAT 标志 时 , 需要 提供 两 个 额外 的 参数 。 mode 参数 指定 谁 可 以 访问 信号 量 。 
mode 的 取 值 和 打开 文件 的 权限 位 相同 : 用 户 读 、 用 户 写 、 用 户 执 行 、 组 读 、 组 写 、 组 执行 、 其 他 
读 、 其 他 写 和 其 他 执行 。 赋 值 给 信号 量 的 权限 可 以 被 调用 者 的 文件 创建 屏蔽 字 修 改 〈 见 4.5 节 和 
4.8 节 )。 注 意 ， 只 有 读 和 写 访问 要 紧 ， 但 是 当 我 们 打开 一 个 现 有 信号 量 时 接口 不 允许 指定 模式 。 
实现 经 常 为 读 和 写 打 开 信号 量 。 
在 创建 信号 量 时 , value 参数 用 来 指定 信和 号 量 的 初始 值 . 它 的 取 值 是 0 一 SEM_VALUE_MAX( 见 图 2-9). 
如 果 我 们 想 确保 创建 的 是 信号 量 ， 可 以 设置 oflag 参数 为 0_CREAT|0_EXCL。 如 果 信 号 量 已 
经 存在 ， 会 导致 sem_open 失败 。 
为 了 增加 可 移植 性 ， 在 选择 信号 量 命名 时 必须 遵循 一 定 的 规则 。 
。 名 字 的 第 一 个 字符 应 该 为 斜 杠 (/)。 尽 管 没 有 要 求 POSIX 信号 量 的 实现 要 使 用 文件 系统 ， 
但 是 如 果 使 用 了 文件 系统 ， 我 们 就 要 在 名 字 被 解释 时 消除 二 义 性 。 
© 名 字 不 应 包含 其 他 斜 杠 以 此 避免 实现 定义 的 行为 。 例 如 ， 如 果 文 件 系统 被 使 用 了 ， 那 么 
名 字 /mysem 和 / /mysem 会 被 认定 为 是 同一 个 文件 名 , 但 是 如 果实 现 没 有 使 用 文件 系统 ， 
那么 这 两 种 命名 可 以 被 认为 是 不 同 的 〈 考 虑 下 如 果实 现 把 名 字 哈 希 运算 转换 成 一 个 用 来 
识别 信号 量 的 整数 值 会 发 生 什 么 )。 
。 信号 量 名 字 的 最 大 长 度 是 实现 定义 的 。 名 字 不 应 该 长 于 _POSIX_NAME_MAX (ILE 2-8) 
个 字符 长 度 。 因 为 这 是 使 用 文件 系统 的 实现 能 允许 的 最 大 名 字 长 度 的 限制 。 
如 果 想 在 信号 量 上 进行 操作 ，sem_open 函数 会 为 我 们 返回 一 个 信号 量 指针 ， 用 于 传递 到 其 他 
信号 量 函数 上 。 当 完成 信号 量 操作 时 ， 可 以 调用 sem close 函数 来 释放 任何 信号 量 相 关 的 资源 。 


#include <semaphore.h> 


int sem close(sem t *sem) ; 





返回 值 : 车 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


如 果 进 程 没有 首先 调用 sem close 而 退出 ， 那 么 内 核 将 自动 关闭 任何 打开 的 信号 量 。 注 意 ， 这 不 
会 影响 信号 量 值 的 状态 一 一 如 果 已 经 对 它 进行 了 增 1 操作 ， 这 并 不 会 仅 因为 退出 而 改变 。 类 似 地 ， 如 果 
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调用 sem_close， 信 和 号 量 值 也 不 会 受到 影响 。 在 XS 信号 量 中 没有 类 似 SEM_UNDO 标志 的 机 制 。 
可 以 使 用 sem unlink 函数 来 销毁 一 个 命名 信和 号 量 。 


#include <semaphore.h> 


int sem unlink(const char *name) ; 





返回 值 : 车 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 | [580 
sem unlink 函数 删除 信号 量 的 名 字 。 如 果 没 有 打开 的 信号 量 引用 ， 则 该 信号 量 会 被 销毁 。 
和 否则， 销毁 将 延迟 到 最 后 一 个 打开 的 引用 关闭 。 
不 像 XSI 信号 量 ， 我 们 只 能 通过 一 个 函数 调用 来 调节 POSIX 信和 号 量 的 值 。 计 数 减 1 和 对 一 
个 二 进 制 信号 量 加 锁 或 者 获取 计数 信号 量 的 相关 资源 是 相 类 似 的 。 
注意 ， 信 号 量 和 POSIX 信号 量 之 间 是 没有 差别 的 。 是 采用 二 进 制 信号 量 还 是 用 计数 信号 量 取 
决 于 如 何 初始 化 和 使 用 信号 量 。 如 果 一 个 信号 量 只 是 有 值 0 或 者 1， 那 么 它 就 是 二 进 制 信号 量 。 
当 二 进 制 信号 量 是 1 时 ， 它 就 是 “解锁 的 "， 如 果 它 的 值 是 0， 那 就 是 “加 锁 的 ”。 


可 以 使 用 sem wait 或 者 sem trywait 函数 来 实现 信号 量 的 减 1 操作 。 


#include <semaphore.h> 


int sem trywait(sem t *sem); 


int sem wait(sem t *sem); 





使 用 sem wait 函数 时 ， 如 果 信 和 号 量 计数 是 0 就 会 发 生 阻 塞 。 直 到 成 功 使 信号 量 减 1 或 者 被 
信和 号 中 断 时 才 返 回 。 可 以 使 用 sem trywait 函数 来 避免 阻塞 。 调 用 sem trywait 时 ， 如 果 信 
号 量 是 0， 则 不 会 阻塞 ， 而 是 会 返回 -1 并 且 将 errno HA EAGAIN. 
第 三 个 选择 是 阻塞 一 段 确 定 的 时 间 。 为 此 ， 可 以 使 用 sem_timewait 函数 。 
#include <semaphore.h> 
#include <time.h> 


int sem_timedwait(sem_t *restrict sem, 
const struct timespec *restrict tsptr); 


返回 值 ， 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 一 1 
想 要 放弃 等 待 信号 量 的 时 候 , 可 以 用 tsptr 参数 指定 绝对 时 间 。 超 时 是 基于 CLOCK_ REALTIME 
时 钟 的 (回忆 图 6-8)。 如 果 信 号 量 可 以 立即 减 1， 那 么 超时 值 就 不 重要 了 ， 尽 管 指 定 的 可 能 是 过 
去 的 某 个 时 间 ， 信 号 量 的 减 1 操作 依然 会 成 功 。 如 果 超 时 到 期 并 且 信 号 量 计 数 没 能 减 1, 
sem timedwait 将 返回 -1 且 将 errno 设置 为 ETIMEDOUT。 
可 以 调用 sem_post 函数 使 信号 量 值 增 1。 这 和 解锁 一 个 二 进 制 信号 量 或 者 释放 一 个 计数 信 
号 量 相关 的 资源 的 过 程 是 类 似 的 。 581 


#include <semaphore.h> 








int sem_post(sem_t *sem) ; 





返回 值 : 车 成 功 ， 返 回 0; 若 出 错 ， 返 回 一 1 


调用 sem post 时 ， 如 果 在 调用 sem wait (或 者 sem timedwait) 中 发 生 进 程 阻塞 ， 那 么 进 
程 会 被 唤醒 并 且 被 sem post 增 1 的 信号 量 计 数 会 再 次 被 sem wait (或 者 sem timedwait) 减 1。 
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当 我 们 想 在 单个 进程 中 使 用 POSIX 信号 量 时 , 使 用 未 命名 信号 量 更 容易 。 这 仅仅 改变 创建 和 
销毁 信号 量 的 方式 。 可 以 调用 sem init 函数 来 创建 一 个 未 命名 的 信号 量 。 


#include <semaphore.h> 


int sem_init(sem_t *sem, int pshared, unsigned int value) ; 


返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 





pshared 参数 表明 是 否 在 多 个 进程 中 使 用 信号 量 。 如 果 是 ， 将 其 设置 成 一 个 非 08. value £ 
数 指定 了 信和 号 量 的 初始 值 。 

需要 声明 一 个 sem_t 类 型 的 变量 并 把 它 的 地 址 传递 给 sem_init 来 实现 初始 化 ， 而 不 是 像 sem_ 
open 函数 那样 返回 一 个 指向 信号 量 的 指针 。 如 果 要 在 两 个 进程 之 间 使 用 信和 号 量 ， 需 要 确保 sem 
参数 指向 两 个 进程 之 间 共 享 的 内 存 范 围 。 

对 未 命名 信号 量 的 使 用 已 经 完成 时 ， 可 以 调用 sem destroy 函数 丢弃 它 。 


#include <semaphore.h> 


int sem destroy(sem t *sem) ; 





调用 sem destroy 后 , 不 能 再 使 用 任何 带 有 sem 的 信号 量 函 数 ， 除 非 通 过 调用 sem init 
重新 初始 化 它 。 
sem getvalue 函数 可 以 用 来 检索 信号 量 值 。 


#include <semaphore.h> 


int sem_getvalue(sem_t *restrict sem, int *restrict valp); 


返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 





Mia, valp 指向 的 整数 值 将 包含 信号 量 值 。 但 是 请 注意 ， 我 们 试图 要 使 用 我 们 刚 读 出 来 的 
值 的 时 候 ， 信 号 量 的 值 可 能 已 经 变 了 。 除 非 使 用 额外 的 同步 机 制 来 避免 这 种 竞争 ， 否 则 sem_ 
getvalue 函数 只 能 用 于 调试 。 


Mac OS X 10.6.8 不 支持 sem_getvalue 函数 。 


FESI 

介绍 POSIX 接口 的 动机 之 一 就 是 ， 通 过 设计 ， 它 们 的 性 能 要 明显 好 于 现 有 XSI 信和 号 量 接口 。 
下 面 将 了 解 现 有 系统 是 否 达 到 了 这 个 目标 ， 尽 管 这 些 系统 没有 设计 支持 实时 的 应 用 。 

在 图 15-34 中 ， 让 3 个 进程 在 两 种 平台 (Linux 3.2.0 和 Solaris 10) 上 竞争 分 配 和 释放 信和 号 量 
1 000 000 次 ， 比 较 了 分 别 使 用 XSI 信号 量 CAI SEM UNDO) All POSIX 信号 量 时 的 性 能 。 


一 
[0 (we [o [e e [nm [em 


| xsi 信号 量 | 11.85 15.85 27.91 0.33 5.93 7.33 
POSIX 信和 号 量 13.72 10.52 24.44 0.26 0.75 0.41 
FA 15-34 信号 量 实现 的 时 间 比 较 


在 图 15-34 中 可 以 看 到 ， 在 Solaris 系统 中 ，POSIX 信号 量 相 对 于 XSI 信和 号 量 在 时 间 上 仅 提 高 了 
12%， 但 是 在 Linux 系统 中 却 提高 了 94% GE 18 倍 的 速度 )。 如 果 跟 踪 程序 ， 我 们 会 发 现 ，POSIX 信号 
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量 的 Linux 实现 将 文件 映射 到 了 进程 地 址 空间 中 ， 并 且 没 有 使 用 系统 调用 来 操作 各 自 的 信号 量 。 m 


m KB 


回忆 图 12-5, Single UNIX Specification 并 没 用 定义 当 一 个 线程 对 一 个 普通 互 斥 量 加 锁 ， 而 
另 一 个 线程 试图 去 解锁 它 的 情况 ， 但 是 这 种 情况 下 错误 检查 互 斥 量 和 递归 互 斥 量 会 产生 错误 。 
因为 二 进 制 信号 量 可 以 像 互 斥 量 一 样 来 使 用 ， 我 们 可 以 使 用 信和 号 量 来 创建 自己 的 锁 原 语 从 而 提 
ftu. 

假设 我 们 将 要 创建 自己 的 锁 ， 这 种 锁 能 被 一 个 线程 加 锁 而 被 另 一 线程 解锁 ， 那 么 它 的 结构 可 
上 是 这 样 的 : 


struct slock { 
sem_t *semp; 
char name[ POSIX NAME MAX]; 


i 
图 15-35 中 的 程序 展示 了 基于 信和 号 量 的 互 斥 原 语 的 实现 。 


#include "slock.h" 
#include <stdlib.h> 
#include <stdio.h> 
#include <unistd.h> 
#include <errno.h> 


struct slock * 583 
s_alloc() 
{ 

struct slock *sp; 

static int cnt; 


if ((sp = malloc (sizeof (struct slock))) == NULL) 
return (NULL) ; 
do { 
snprintf(sp->name, sizeof(sp->name), "/%ld.%d", (long)getpid(), 
ent++); 


sp->semp = sem_open(sp->name, O_CREAT|O_EXCL, S_IRWXU, 1); 
} while ((sp->semp == SEM_FAILED) && (errno == EEXIST)); 
if (sp->semp == SEM_FAILED) { 
free (sp); 
return (NULL) ; 
} 
sem unlink(sp-»name); 
return (sp); 


} 


void 
s_free(struct slock *sp) 
{ 
sem close(sp-»semp); 
free(sp); 
) 


int 
s lock(struct slock *sp) 
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{ 
return (sem_wait (sp->semp)); 


} 


int 
s_trylock(struct slock *sp) 
{ 
return (sem_trywait (sp->semp) ) ; 
} 
int 
s_unlock(struct slock *sp) 
{ 
return (sem_post (sp->semp) ); 


} 
图 15-35 ”使 用 POSIX 信号 量 的 互 斥 


根据 进程 ID 和 计数 器 来 创建 名 字 。 我 们 不 会 刻意 用 互 斥 量 去 保护 计数 器 ， 因 为 当 两 个 竞争 

的 线程 同时 调用 s_alloc 并 以 同一 个 名 字 结 束 时 ， 在 调用 sem open 中 使 用 O_EXCL 标志 将 会 

使 其 中 一 个 线程 成 功 而 另 一 个 线程 失败 ， 失 败 的 线程 会 将 errno 设置 成 EEXIST， 所 以 对 于 这 种 
情况 ， 我 们 只 是 再 次 尝试。 注意 ， 我 们 打开 一 个 信号 量 后 断 开 了 它 的 连接 。 这 销毁 了 名 字 ， 所 以 
导致 其 他 进程 不 能 再 次 访问 它 ， 这 也 简化 了 进程 结束 时 的 清理 工作 。 a 
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下 面 详细 说 明 客 户 进程 和 服务 器 进程 的 某 些 属性 ， 这 些 属 性 受到 它们 之 间 所 使 用 的 各 种 IPC 
类 型 的 影响 。 最 简单 的 关系 类 型 是 使 客户 进程 fork 然后 exec 所 希望 的 服务 器 进程 。 在 fork 
之 前 先 创建 两 个 半 双 工 管道 使 数据 可 在 两 个 方向 传输 。 图 15-16 是 这 种 安排 的 一 个 例子 。 所 执行 
的 服务 器 进程 可 能 是 一 个 设置 用 户 ID 的 程序 ， 这 使 它 具 有 了 特权 。 另 外 ， 服 务 器 进程 查看 客户 
进程 的 实际 用 户 ID 就 可 以 决定 客户 进程 的 真实 身份 。( 回 忆 8.10 节 ， 从 中 可 了 解 到 在 exec 前 后 
实际 用 户 ID 和 实际 组 ID 并 没有 改变 。) 

在 这 种 安排 下 ， 可 以 构建 一 个 open 服务 器 进程 Copen server)。(17.5 节 提 供 了 这 种 客户 进程 - 
服务 器 进程 机 制 的 一 种 实现 。) 它 为 客户 进程 打开 文件 而 不 是 客户 进程 自己 调用 open 函数 。 这 样 
就 可 以 在 正常 的 UNIX 用 户 权 限 、 组 权限 以 及 其 他 权限 之 上 或 之 外 ， 增 加 附加 的 权限 检查 。 假 定 
服务 器 进程 执行 的 是 设置 用 户 ID 程序 ， 这 给 予 了 它 附 加 的 权限 (很 可 能 是 root 权限 )。 服 务 器 进 
程 用 客户 进程 的 实际 用 户 ID 来 决定 是 否 给 予 它 对 所 请 求 文件 的 访问 权限 。 使 用 这 种 方式 ， 可 以 
构建 一 个 服务 器 进程 ， 它 允许 某 些 用 户 获得 通常 没有 的 访问 权限 。 

在 此 例子 中 ， 因 为 服务 器 进程 是 父 进程 的 子 进程 ， 所 以 它 所 能 做 的 就 是 将 文件 内 容 传送 给 父 
进程 。 尽 管 这 种 方式 对 普通 文件 工作 得 很 好 ， 但 是 对 有 些 文 件 却 不 能 工作 ， 如 特殊 设备 文件 。 我 
们 希望 能 做 的 是 使 服务 器 进程 打开 所 要 求 的 文件 ， 并 传 回 文件 描述 符 。 但 是 实际 情况 却 是 父 进 程 
可 向 子 进程 传送 打开 文件 描述 符 ， 而 子 进 程 却 不 能 向 父 进 程 传 回 文件 描述 符 《〈 除 非 使 用 专门 的 编 
程 技术 ， 这 将 在 第 17 章 介 绍 )。 

图 15-23 中 展示 了 另 一 种 类 型 的 服务 器 进程 。 这 种 服务 器 进程 是 一 个 守护 进程 ， 所 有 客户 进 
程 用 某 种 形式 的 IPC 与 其 联系 。 对 于 这 种 形式 的 客户 进程 -服务 器 进程 关系 ， 不 能 使 用 管道 。 需 
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要 使 用 一 种 形式 的 命名 IPC， 如 FIFO 或 消息 队列 。 使 用 FIFO 时 ， 如 果 服 务 器 进程 必需 将 数据 送 
回 客户 进程 ， 则 对 每 个 客户 进程 都 要 有 单独 使 用 的 FIFO。 如 果 客 户 进 程 -服务 器 进程 应 用 程序 只 
有 客户 进程 向 服务 器 进程 发 送 数据 ， 则 只 需要 一 个 众所周知 的 FIFO。(System V 行 式 打印 机 假 脱 
机 程序 使 用 这 种 形式 的 客户 进程 -服务 器 进程 。 客 户 进程 是 1p(1) 命 令 ， 服 务 器 进程 是 lpsched 
守护 进程 。 因 为 只 有 从 客户 进程 到 服务 器 进程 的 数据 流 ， 所 有 只 需 使 用 一 个 FIFO。 没有 需要 送 回 
客户 进程 的 数据 。) 

使 用 消息 队列 则 存在 多 种 可 能 

C1) 在 服务 器 进程 和 所 有 客户 进程 之 间 只 使 用 一 个 队列 ， 使 用 每 个 消息 的 类 型 字段 指明 谁 是 
消息 的 接受 者 。 例 如 ， 客 户 进程 可 以 用 设置 为 1 的 类 型 字段 来 发 送 它们 的 消息 。 在 请 求 之 中 应 包 
括 客 户 进程 的 进程 ID。 此后， 服务 器 进程 在 发 送 响应 消息 时 ， 将 类 型 字段 设置 为 客户 进程 的 进程 
ID。 服 务 器 进程 只 接受 类 型 字段 为 1 的 消息 (msgrcv 的 第 4 个 参数 )， 客 户 进程 则 只 接受 类 型 字 
段 等 于 它们 进程 ID 的 消息 。 

(2) 另 一 种 方法 是 每 个 客户 进程 使 用 一 个 单独 的 消息 队列 。 在 向 服务 器 进程 发 送 第 一 个 请 求 
之 前 ， 每 个 客户 进程 先 使 用 键 ITPC_PRIVATE 创建 它 自己 的 消息 队列 。 服 务 器 进程 也 有 它 自己 的 
队列 ， 其 键 或 标识 符 是 所 有 客户 进程 都 知道 的 。 客 户 进程 将 其 第 一 个 请 求 发 送 到 服务 器 进程 的 众 
所 周知 的 队列 上 ， 该 请 求 中 应 包含 其 客户 进程 消息 队列 的 队列 ID。 服务 器 进程 将 其 第 一 个 响应 发 
送 到 此 客户 进程 队列 ， 此 后 的 所 有 请 求 和 响应 都 在 此 队列 上 交换 。 

使 用 消息 队列 的 这 两 种 技术 都 可 以 用 共享 内 存 段 和 同步 方法 《信号 量 或 记录 锁 ) 来 实现 。 

使 用 这 种 类 型 的 客户 进程 -服务 器 进程 关系 《客户 进程 和 服务 器 进程 是 无 关 进程 ) 的 问题 是 
服务 器 进程 如 何 准确 地 标识 客户 进程 。 除 非 服务 器 进程 正在 执行 一 种 非特 权 操 作 ， 否 则 服务 器 进 
程 知 道 客 户 进程 的 身份 是 很 重要 的 。 例 如 ， 若 服务 器 进程 是 一 个 设置 用 户 ID 程序 ， 就 有 这 种 要 
求 。 虽然 所 有 这 几 种 形式 的 IPC 都 经 由 内 核 , 但 是 它们 并 未 提供 任何 设施 使 内 核能 够 标识 发 送 者 。 

对 于 消息 队列 ， 如 果 在 客户 进程 和 服务 器 进程 之 间 使 用 一 个 专用 队列 (于 是 一 次 只 有 一 个 消 
息 在 该 队列 上 )， 那 么 队列 的 msg_lspid 包含 了 对 方 进程 的 进程 ID。 但 是 当 客 户 进程 将 请 求 发 
送 给 服务 器 进程 时 ， 我 们 想 要 的 是 客户 进程 的 有 效用 户 ID， 而 不 是 它 的 进程 ID 。 现 在 还 没有 一 
种 可 移植 的 方法 ,在 已 知 进程 ID 情况 下 可 以 得 到 有 效用 户 ID。( 自 然 地 ， 内 核 在 进程 表 项 中 保持 
有 这 两 种 值 ， 但 是 除非 彻底 检查 内 核 存 储 空间 ， 否 则 已 知 一 个 ， 无 法 得 到 另 一 个 。) 

我 们 将 在 17.2 节 中 使 用 下 列 技术 ， 使 服务 器 进程 可 以 标识 客户 进程 。 这 一 技术 可 使 用 FIFO、 
消息 队列 、 信号 量 以 及 共享 存储 。 在 下 面 的 说 明 中 假定 按 图 15-23 使 用 了 FIFO. 客户 进程 必须 创建 
CACM FIFO, 并 且 设 置 该 FIFO 的 文件 访问 权限 ， 使 得 只 允许 用 户 读 和 用 户 写 。 假 定 服务 器 进程 
有 具 有 超级 用 户 特权 (或 者 它 很 可 能 并 不 关心 客户 进程 的 真实 标识 )， 那 么 服务 器 进程 仍 可 读 、 写 此 
FIFO。 当 服务 器 进程 在 众所周知 的 FIFO 上 接收 到 客户 进程 的 第 一 个 请 求 时 〔 它 应 当 包 含 客户 进程 
专用 FIFO 的 标识 )， 服 务 器 进程 调用 针对 客户 进程 专用 FIFO 的 stat 或 fstat。 服 务 器 进程 假设 : 
客户 进程 的 有 效用 户 ID 是 FIFO 的 所 有 者 (stat 结构 的 st uia 字段 )。 服 务 器 进程 验证 该 FIFO 
只 有 用 户 读 和 用 户 写 权限 。 服 务 器 进程 还 应 检查 与 该 FIFO 有 关 的 3 个 时 间 量 (stat 结构 的 st_ 
atime, st mtime 和 st_ctime 字段 )， 要 检查 它们 与 当前 时 间 是 否 很 接近 (如 不 早 于 当前 时 间 
15 秒 或 30 秒 )。 如 果 一 个 恶意 客户 进程 可 以 创建 一 个 FIFO， 使 男 一 个 用 户 成 为 其 所 有 者 ， 并 且 设 
置 该 文件 的 权限 位 为 用 户 读 和 用 户 写 ， 那 么 在 系统 中 就 存在 了 其 他 基础 性 的 安全 问题 。 586 

为 了 用 XSI IPC 实现 这 种 技术 ， 回 想 一 下 与 每 个 消息 队列 、 信 和 号 量 以 及 共享 存储 段 相 关 的 ipc_ 
perm 结构 ， 它 标识 了 IPC 结构 的 创建 者 (cuid 和 cgid 字段 )。 和 使 用 FIFO 的 实例 一 样 ， 服 务 
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器 进程 应 当 要 求 客户 进程 创建 该 PC 结构 , 并 使 客户 进程 将 访问 权 设 置 为 只 允许 用 户 读 和 用 户 写 。 
服务 器 进程 也 应 检验 与 该 IPC 相关 的 时 间 值 与 当前 时 间 是 否 很 接近 《因为 这 些 IPC. 结构 在 显 式 地 
删除 之 前 一 直 存在 )。 

在 17.3 节 中 , 将 会 看 到 进行 这 种 身份 验证 的 一 种 更 好 的 方法 ,就 是 内 核 提 供 客户 进程 的 有 效 
FAP ID 和 有 效 组 ID。 套 接 字 子 系统 在 两 个 进程 之 间 传 送 文 件 描述 符 时 可 以 做 到 这 一 点 。 


15.12 小 结 


本 章 详细 说 明了 进程 间 通 信 的 多 种 形式 : 管道 、 命 名 管道 (FIFO)、 通 常 称 为 XSI IPC 的 3 
种 形式 的 IPC (消息 队列 、 信 和 号 量 和 共享 存储 )， 以 及 POSIX 提供 的 蔡 代 信号 量 机 制 。 信 号 量 实 
际 上 是 同步 原 语 而 不 是 IPC， 常 用 于 共享 资源 〈 如 共享 存储 段 ) 的 同步 访问 。 对 于 管道 ， 我 们 说 
明了 popen 函数 的 实现 、 协 同 进程 以 及 使 用 标准 VO 库 缓 冲 机 制 时 可 能 遇 到 的 问题 。 

经 过 分 别 对 消息 队列 与 全 双 工 管道 的 时 间 以 及 信和 号 量 与 记录 锁 的 时 间 进 行 比 较 ， 提 出 了 下 列 
建议 : 要 学 会 使 用 管道 和 FIFO, 因为 这 两 种 基本 技术 仍 可 有 效 地 应 用 于 大 量 的 应 用 程序 。 在 新 的 
应 用 程序 中 ， 要 尽 可 能 避免 使 用 消息 队列 以 及 信号 量 ， 而 应 当 考 虑 全 双 工 管道 和 记录 锁 ， 它 们 使 
用 起 来 会 简单 得 多 。 共 享 存 储 仍 然 有 它 的 用 途 ， 虽 然 通过 mmap 函数 〈 见 14.8 节 ) 也 能 提供 同样 
的 功能 。 

下 一 章 将 介绍 网 络 PC， 它 们 使 进程 能 够 跨越 计算 机 的 边界 进行 通信 。 


习题 


15.1 在 图 15-6 的 程序 中 ， 在 父 进 程 代码 的 末尾 删除 waitpid 前 的 close， 结 果 将 如 何 ? 

15.2 在 图 15-6 的 程序 中 ， 在 父 进程 代码 的 末尾 删除 waitpid， 结 果 将 如 何 ? 

15.3 如 果 popen 函数 的 参数 是 一 个 不 存在 的 命令 ， 会 造成 什么 结果 ? 编写 一 段 小 程序 对 此 进行 
测试 。 

15.4 7E 15-18 的 程序 中 ， 删 除 信号 处 理 程序 ， 执 行 该 程序 ， 然 后 终止 子 进程 。 输 入 一 行 输入 后 ， 
怎样 才能 说 明 父 进程 是 由 SIGPIPE 终止 的 ? 

15.5 在 图 15-18 的 程序 中 ， 用 标准 UO 库 代 替 进 行 管道 读 、 写 的 read 和 write. 

15.6 POSIX.1 加 入 waitpid 函数 的 理由 之 一 是 ，POSIX.1 之 前 的 大 多 数 系统 不 能 处 理 下 面 的 
代码 。 


if ( (fp = popen("/bin/true", "r")) == NULL ) 
if ( (re = system("sleep 100")) == -1) 
if (pclose(fp) == -1) 


若 在 这 段 代 码 中 不 使 用 waitpid 函数 会 如 何 ? 用 wait 代替 呢 ? 

15.7 当 一 个 管道 被 写 者 关闭 后 ， 解 释 select 和 poll 是 如 何 处 理 该 管道 的 输入 描述 符 的 。 为 
了 确定 答案 是 否 正确 ， 编 两 个 小 测试 程序 ， 一 个 用 select， 另 一 个 用 poll. 
当 一 个 管道 的 读 端 被 关闭 时 ， 请 重 做 此 习题 以 查看 该 管道 的 输出 描述 符 。 

15.8 如 果 popen 以 type 为 "r" 执 行 cmqdstring， 并 将 结果 写 到 标准 错误 输出 ， 结 果 会 如 何 ? 
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15.9 既然 popen 函数 能 使 shell 执行 它 的 cmdstring BR, HA cmdstring 终止 时 会 产生 什么 结 
R? (提示 : 画 出 与 此 相关 的 所 有 进程 。) 

15.10 POSIX.1 特别 声明 没有 定义 为 读 写 而 打开 FIFO。 虽 然 大 多 数 UNIX 系统 允许 读 写 FIFO, 
但 是 请 用 非 阻塞 方法 实现 为 读 写 而 打开 FIFO。 

15.11 除非 文件 包含 敏感 数据 或 机 密 数据 ， 否 则 允许 其 他 用 户 读 文件 不 会 造成 损害 。 但 是 ， 如 果 
一 个 恶意 进程 读 取 了 被 一 个 服务 器 进程 和 几 个 客户 进程 使 用 的 消息 队列 中 的 一 条 消息 后 ， 
会 产生 什么 后 果 ? 恶意 进程 需要 知道 哪些 信息 就 可 以 读 消息 队列 ? 

15.12 编写 一 段 程序 完成 下 面 的 工作 。 执 行 一 个 循环 5 次 ， 在 每 次 循环 中 ， 创 建 一 个 消息 队列 ， 
打印 该 队列 的 标识 符 ， 然 后 删除 队列 。 接 着 再 循环 S 次 ， 在 每 次 循环 中 利用 键 IPC_PRIVATE 
创建 消息 队列 ， 并 将 一 条 消息 放 在 队列 中 。 程 序 终 止 后 用 ipcs(1) 查 看 消息 队列 。 解 释 队 
列 标识 符 的 变化 。 

15.13. 描述 如 何在 共享 存储 段 中 建立 一 个 数据 对 象 的 链接 列表 。 列 表 指 针 如 何 存储 ? 

15.14 EHE 15-33 中 的 程序 运行 时 下 列 值 随时 间 变 化 的 曲线 图 : 父 进程 和 子 进 程 中 的 变量 i. 
共享 存储 区 中 的 长 整 型 值 以 及 update 函数 的 返回 值 。 假 设 子 进程 在 fork 后 先 运行 。 

15.15 使 用 15.9 节 中 的 XSI 共享 存储 函数 代替 共享 存储 映射 区 ， 改 写 图 15-33 中 的 程序 。 

15.16 使 用 15.8 节 中 的 XSI 信号 量 函 数 改 写 图 15-33 中 的 程序 ， 实 现 父 进程 与 子 进程 间 的 交替 。 

15.17 使 用 建议 性 记录 锁 改写 图 15-33 中 的 程序 ， 实 现 父 进程 与 子 进程 间 的 交替 。 

15.18 使 用 15.10 节 中 的 POSIX 信号 量 函数 改写 图 15-33 中 的 程序 ， 实 现 父 进程 与 子 进程 间 的 交替 。 


第 16 Ht 
网 络 PC: £j 





16.1 引言 


上 一 章 我 们 考察 了 各 种 UNIX 系统 所 提供 的 经 典 进 程 间 通 信 机 制 (IPC): 管道 、FIFO、 消 息 
队列 、 信 号 量 以 及 共享 存储 。 这 些 机 制 允许 在 同一 台 计 算 机 上 运行 的 进程 可 以 相互 通信 。 本 章 将 
考察 不 同 计 算 机 (通过 网 络 相 连 ) 上 的 进程 相互 通信 的 机 制 : 网络 进 程 间 通信 (network IPC). 

在 本 章 中 ， 我 们 将 描述 套 接 字 网 络 进程 间 通 信 接 口 ， 进 程 用 该 接口 能 够 和 其 他 进程 通信 ， 无 
论 它们 是 在 同一 台 计 算 机 上 还 是 在 不 同 的 计算 机 上 。 实 际 上 ， 这 正 是 套 接 字 接口 的 设计 目标 之 一 : 
同样 的 接口 既 可 以 用 于 计算 机 间 通 信 ， 也 可 以 用 于 计算 机 内 通信 。 尽 管 套 接 字 接 口 可 以 采用 许多 
不 同 的 网 络 协议 进行 通信 ， 但 本 章 的 讨论 限制 在 因特网 事实 上 的 通信 标准 : TCP/IP 协议 栈 。 

POSIX.1 中 指定 的 套 接 字 API 是 基于 4.4 BSD 套 接 字 接 口 的 。 尽 管 这 些 年 套 接 字 接口 有 些 细 
微 的 变化 ， 但 是 当前 的 套 接 字 接 口 与 20 世纪 80 年 代 早期 4.2BSD 所 引入 的 接口 很 类 似 。 

本 章 仅 是 一 个 套 接 字 API 的 概述 。Stevens、Fenner 和 Rudoff[2004] 在 有 关 UNIX 系统 网 络 编 

程 的 权威 性 文献 中 详细 讨论 了 套 接 字 接口 。 
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套 接 字 是 通信 端点 的 抽象 。 正 如 使 用 文件 描述 符 访问 文件 ， 应 用 程序 用 套 接 字 描述 符 访问 套 
接 字 。 套 接 字 描述 符 在 UNIX 系统 中 被 当 作 是 一 种 文件 描述 符 。 事 实 上 ， 许 多 处 理 文件 描述 符 的 
函数 (如 read 和 write) 可 以 用 于 处 理 套 接 字 描述 符 。 

为 创建 一 个 套 接 字 ， 调 用 socket 函数 。 


#include <sys/socket.h> 


int socket (int domain, int type, int protocol) ; 


BEH: 若 成 功 ， 返 回 文件 〈 套 接 字 ) 描述 符 ， 若 出 错 ， 返 回 -1 








参数 domain (bh) 确定 通信 的 特性 ， 包 括 地 址 格式 〈 在 下 一 节 详 细 描 述 )。 图 16-1 总 结 了 由 
POSIX.1 指定 的 各 个 域 。 各 个 域 都 有 自己 表示 地 址 的 格式 ， 而 表示 各 个 域 的 常数 都 以 AF 开头， 
意 指 地 址 族 (address family). 

我 们 将 在 17.2 节 讨论 UNIX th. 大 多 数 系统 还 定义 了 AF LOCAL W, 这 是 AF. UNIX 的 别名 。 
AF UNSPEC 域 可 以 代表 “任何 ” 域 。 历 史上 ， 有 些 平台 支持 其 他 网 络 协议 ， 如 AF_IPX 域 代表 
的 NetWare 协议 族 ， 但 这 些 协 议 的 域 常数 没有 被 POSIX.1 标准 定义 。 
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AF_INET IPv4 因特网 域 


AF_INET6 IPv6 因特网 域 
AF_UNIX UNIX 域 
AF_UPSPEC 未 指定 
16-1 套 接 字 通 信 域 
参数 type 确定 套 接 字 的 类 型 ， 进 一 步 确定 通信 特征 。 图 16-2 总 结 了 由 POSIX.1 定义 的 套 接 
字 类 型 ， 但 在 实现 中 可 以 自由 增加 其 他 类 型 的 支持 。 

















固定 长 度 的 、 无 连接 的 、 不 可 靠 的 报 文 传递 
IP 协议 的 数据 报 接口 〈 在 POSIX.1 中 为 可 选 ) 
固定 长 度 的 、 有 序 的 、 可 靠 的 、 面 向 连接 的 报 文 传递 
有 序 的 、 可 靠 的 、 双 向 的 、 面 向 连接 的 字 节 流 
图 16-2” 套 接 字 类 型 

参数 protocol 通常 是 0， 表 示 为 给 定 的 域 和 套 接 字 类 型 选择 默认 协议 。 当 对 同一 域 和 套 接 字 
类 型 支持 多 个 协议 时 ， 可 以 使 用 protocol 选择 一 个 特定 协议 。 在 AF INET 通信 域 中 ， 套 接 字 类 型 
SOCK STREAM 的 默认 协议 是 传输 控制 协议 (Transmission Control Protocol，TCP)。 在 AF_INET 通信 
域 中 ， 套 接 字 类 型 SOCK DGRAM 的 默认 协议 是 UDP。 图 16-3 列 出 了 为 因特网 域 套 接 字 定义 的 协议 。 


SOCK_DGRAM 
SOCK_RAW 

SOCK_SEQPACKET 
SOCK_STREAM 











IPPROTO_IP IPv4 网 际 协议 
IPPROTO_IPV6 IPv6 网 际 协 议 〈 在 POSX.1 中 为 可 选 ) 


IPPROTO_ICMP 因特网 控制 报 文 协 议 (Internet Control Message Protocol) 
IPPROTO_RAW 原始 IP 数据 包 协 议 (在 POSX.1 中 为 可 选 ) 
IPPROTO_TCP 传输 控制 协议 

IPPROTO_UDP 用 户 数据 报 协 议 (User Datagram Protocol) 





图 16-3 为 因特网 域 套 接 字 定义 的 协议 

对 于 数据 报 (SOCK_DGRAM) 接口 ， 两 个 对 等 进程 之 间 通 信和 时 不 需要 逻辑 连接 。 只 需要 向 对 
等 进程 所 使 用 的 套 接 字 送 出 一 个 报 文 。 

因此 数据 报 提供 了 一 个 无 连接 的 服务 。 另 一 方面 ， 字 节 流 CSOCK_STREAM) 要 求 在 交换 数 
据 之 前 ， 在 本 地 套 接 字 和 通信 的 对 等 进程 的 套 接 字 之 间 建 立 一 个 逻辑 连接 。 

数据 报 是 自 包含 报 文 。 发 送 数 据 报 近似 于 给 某 人 邮寄 信件 。 你 能 邮寄 很 多 和信， 但 你 不 能 保证 
传递 的 次 序 ， 并 且 可 能 有 些 信件 会 丢失 在 路 上 。 每 封 信件 包含 接收 者 地 址 ， 使 这 封 信件 独立 于 所 
有 其 他 信件 。 每 封 信 件 可 能 送 达 不 同 的 接收 者 。 

相反 ， 使 用 面向 连接 的 协议 通信 就 像 与 对 方 打 电话 。 首 先 ， 需 要 通过 电话 建立 一 个 连接 ， 连 
接 建 立 好 之 后 ， 彼 此 能 双向 地 通信 。 每 个 连接 是 端 到 端的 通信 链 路 。 对 话 中 不 包含 地 址 信息 ， 就 
像 呼 叫 两 端 存在 一 个 点 对 点 虚拟 连接 ， 并 且 连 接 本 身上 暗示 特定 的 源 和 目的 地 。 

SOCK STREAM 套 接 字 提 供 字 节 流 服务 ， 所 以 应 用 程序 分 辨 不 出 报 文 的 界限 。 这 意味 着 从 
SOCK STREAM 套 接 字 读 数据 时 ， 它 也 许 不 会 返回 所 有 由 发 送 进程 所 写 的 字 节 数 。 最 终 可 以 获得 
发 送 过 来 的 所 有 数据 ， 但 也 许 要 通过 若干 次 函数 调用 才能 得 到 。 
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SOCK_SEQPACKET 套 接 字 和 SOCK_STREAM 套 接 字 很 类 似 ， 只 是 从 该 套 接 字 得 到 的 是 基于 
报 文 的 服务 而 不 是 字 节 流 服务 。 这 意味 着 从 SOCK_SEQPACKET 套 接 字 接收 的 数据 量 与 对 方 所 发 
送 的 一 致 。 流 控制 传输 协议 (Stream Control Transmission Protocol, SCTP) 提供 了 因特网 域 上 的 
顺序 数据 包 服 务 。 

SOCK RAW 套 接 字 提 供 一 个 数据 报 接口 ， 用 于 直接 访问 下 面 的 网 络 层 〈 即 因特网 域 中 的 IP 
层 )。 使 用 这 个 接口 时 ， 应 用 程序 负责 构造 自己 的 协议 头 部 ， 这 是 因为 传输 协议 (如 TCP 和 UDP) 
被 绕 过 了 。 当 创建 一 个 原始 套 接 字 时 ， 需 要 有 超级 用 户 特 权 ， 这 样 可 以 防止 恶意 应 用 程序 绕 过 内 
建安 全 机 制 来 创建 报 文 。 

调用 socket 与 调用 open 相 类 似 。 在 两 种 情况 下 ， 均 可 获得 用 于 VO 的 文件 描述 符 。 当 不 再 需 
要 该 文件 描述 符 时 ， 调 用 close 来 关闭 对 文件 或 套 接 字 的 访问 ， 并 且 释 放 该 描述 符 以 便 重新 使 用 。 

虽然 套 接 字 描述 符 本 质 上 是 一 个 文件 描述 符 ， 但 不 是 所 有 参数 为 文件 描述 符 的 函数 都 可 以 接 
受 套 接 字 描述 符 。 图 16-4 总 结 了 到 目前 为 止 所 讨论 的 大 多 数 以 文件 描述 符 为 参数 的 函数 使 用 套 接 
字 描 述 符 时 的 行为 。 未 指定 和 由 实现 定义 的 行为 通常 意味 着 该 函数 对 套 接 字 描 述 符 无 效 。 例 如 ， 
lseek 不 能 以 套 接 字 描 述 符 为 参数 ， 因 为 套 接 字 不 支持 文件 偏 移 量 的 概念 。 


close ( 见 3.5 节 ) 释放 套 接 字 

Dup 和 dup2 ( 见 3.12 节 ) 和 一 般 文件 描述 符 一 样 复制 

fchdir (Ji 4.23 节 ) 失败 ， 并 且 将 errno 设置 为 ENOTDIR 

fchomod ( 见 4.9 节 ) 未 指定 

fchown ( 见 4.11 节 ) 由 实现 定义 

fcntl (H 3.14 45) 支持 一 些 命令 , 包括 F_DUPFD, F_DUPFD_CLOEXEC, F_GETFD, 
F GETFL. F_GETOWN, F SETFD. F SETFL fil F SETOWN 

Fdatasync All fsync (73.13 4) 由 实现 定义 

fstat ( 见 4.2 节 ) 支持 一 些 stat 结构 成 员 ， 但 如 何 支 持 由 实现 定义 

ftruncate ( 见 4.13 节 ) 未 指定 

ioctl ( 见 3.15 节 ) 支持 部 分 命令 ， 依 赖 于 底层 设备 驱动 

lseek ( 见 3.6 节 ) 由 实现 定义 (通常 失败 时 会 将 errno 设 为 BSPIPE) 

mmap (Ji, 14.8 5) 未 指定 

poll ( 见 14.4.2 15) 正常 工作 

Pread All pwrite ( 见 3.11 节 ) 失败 时 会 将 errno 设 为 ESPIPE 

read ( 见 3.7 节 ) 和 readv CM 14.6 节 ) 与 没有 任何 标志 位 的 recv (CA 16.5 节 ) 等 价 

select (J 14.4.1 节 ) 正常 工作 

write ( 见 3.8 节 ) 和 writev ( 见 14.6 节 ) 与 没有 任何 标志 位 的 send (A 16.5 节 ) 等 价 


16-4. 文件 描述 符 函数 使 用 套 接 字 时 的 行为 
套 接 字 通信 是 双向 的 。 可 以 采用 shutdown 函数 来 禁止 一 个 套 接 字 的 IO。 


#include <sys/socket.h> 





int shutdown (int sockfd, int how); 





返回 值 ， 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 
如 果 how 是 SHUT_RD (关闭 读 端 )， 那 么 无 法 从 套 接 字 读 取 数 据 。 如 果 how 是 SHUT WR. (KAI'S 
端 )， 那 么 无 法 使 用 套 接 字 发 送 数 据 。 如 果 how 是 SHUT_RDWR， 则 既 无 法 读 取 数据 ， 又 无 法 发 送 数 据 。 
能 够 关闭 (close) 一 个 套 接 字 ， 为 何 还 使 用 shutdown 呢 ? 这 里 有 若干 理由 。 首 先 ， 只 有 
最 后 一 个 活动 引用 关闭 时 ，close 才 释 放 网 络 端点 。 这 意味 着 如 果 复 制 一 个 套 接 字 (如 采用 dup), 
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要 直到 关闭 了 最 后 一 个 引用 它 的 文件 描述 符 才 会 释放 这 个 套 接 字 。 而 shutdown 允许 使 一 个 套 接 
字 处 于 不 活动 状态 ， 和 引用 它 的 文件 描述 符 数目 无 关 。 其 次 ， 有 时 可 以 很 方便 地 关闭 套 接 字 双 向 
传输 中 的 一 个 方向 。 例 如 ， 如 果 想 让 所 通信 的 进程 能 够 确定 数据 传输 何 时 结束 ， 可 以 关闭 该 套 接 
字 的 写 端 ， 然 而 通过 该 套 接 字 读 端 仍 可 以 继续 接收 数据 。 


16.3 Sut 


上 一 节 学 习 了 如 何 创 建 和 销毁 一 个 套 接 字 。 在 学 习 用 套 接 字 做 一 些 有 意义 的 事情 之 前 ， 需 要 
知道 如 何 标识 一 个 目标 通信 进程 。 进 程 标识 由 两 部 分 组 成 。 一 部 分 是 计算 机 的 网 络 地 址 ， 它 可 以 
帮助 标识 网 络 上 我 们 想 与 之 通信 的 计算 机 ; 另 一 部 分 是 该 计算 机 上 用 端口 号 表示 的 服务 ， 它 可 以 
帮助 标识 特定 的 进程 。 


16.3. Vie 


与 同一 台 计 算 机 上 的 进程 进行 通信 时 , 一 般 不 用 考虑 字 节 序 。 字 节 序 是 一 个 处 理 器 架构 特性 ， 
用 于 指示 像 整 数 这 样 的 大 数据 类 型 内 部 的 字 节 如 何 排序 。 图 16-5 显示 了 一 个 32 位 整数 中 的 字 节 





是 如 何 排 序 的 。 X 

如 果 处 理 器 架构 支持 大 端 C(big-endian) 字 节 序 ， 那 么 最 大 d a naa tee 
字 节 地 址 出 现在 最 低 有 效 字 节 (Least Significant Byte, LSB) E. J we: 
小 端 (little-endian) 字 节 序 则 相反 : 最 低 有 效 字 节 包含 最 小 字 节 MS LSB 
地 址 。 注意 , 不 管 字 节 如 何 排序 ， 最 高 有 效 字 节 (Most Significant 小 端 





Byte, MSB) 总 是 在 左边 ， 最 低 有 效 字 节 总 是 在 右边 。 因 此 ， 如 
果 想 给 一 个 32 位 整数 赋值 0x04030201， 不 管 字 节 序 如 何 ， 最 


n3 :11+2 n+l: n 





高 有 效 字 节 都 将 包含 4， 最 低 有 效 字 节 都 将 包含 1。 如 果 接 下 来 想 MSB LSB 
将 一 个 字符 指针 (op) 强制 转换 到 这 个 整数 地 址 ， 就 会 看 到 字 节 图 16-5 一 个 32 位 整数 的 字 节 序 
序 带 来 的 不 同 。 在 小 端 字 节 序 的 处 理 器 上 ，cp [0] 指向 最 低 有 效 字 节 因 而 包含 1，cp [3] 指 向 最 高 
有 效 字 节 因而 包含 4。 相 比较 而 言 ， 在 大 端 字 节 序 的 处 理 器 上 ，cp [0] 指 向 最 高 有 效 字 节 因 而 包 
含 4，cp[3] 指 向 最 低 有 效 字 节 因而 包含 1。 图 16-6 总 结 了 本 文 所 讨论 的 4 种 平台 的 字 节 序 。 


FreeBSD 8.0 Intel Pentium 


Linux 3.2.0 Intel Core iS 
Mac OS X 10.6.8 Intel Core 2 Duo 
Solaris 10 Sun SPARC 


图 16-6 ”测试 平台 的 字 节 序 





有 些 处 理 器 可 以 配置 成 大 端 ， 也 可 以 配置 成 小 端 ， 因 而 使 问题 变 得 更 让 人 困 意 。 


网 络 协 议 指 定 了 字 节 序 ， 因 此 异 构 计 算 机 系统 能 够 交换 协议 信息 而 不 会 被 字 节 序 所 混淆 。 
TCP/IP 协议 栈 使 用 大 端 字 节 序 。 应 用 程序 交换 格式 化 数据 时 ， 字 节 序 问题 就 会 出 现 。 对 于 TCP/IP， 
地 址 用 网 络 字 节 序 来 表示 ， 所 以 应 用 程序 有 时 需要 在 处 理 器 的 字 节 序 与 网 络 字 节 序 之 间 转 换 它 
们 。 例 如 ， 以 一 种 易 读 的 形式 打印 一 个 地 址 时 ， 这 种 转换 很 常见 。 

对 于 TCP/IP 应 用 程序 ， 有 4 个 用 来 在 处 理 器 字 节 序 和 网 络 字 节 序 之 间 实 施 转换 的 函数 。 
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#include <arpa/inet.h> 
uint32 t htonl(uint32 t hostint32) ; 


: 以 网 络 字 节 序 表示 的 32 位 整数 
uint16 t htons(uint16_t hostint16); 


i: 以 网 络 字 节 序 表示 的 16 位 整数 


uint32 t ntohl(uint32 t nmetint32) ; 


: 以 主机 字 节 序 表示 的 32 位 整数 
uintl6 t ntohs (uint16 t netint16); 





: 以 主机 字 节 序 表示 的 16 位 整数 


h 表示 “主机 ” 字 节 序 ，n 表示 “网 络 ” 字 节 序 。1 表示 “长 ”( 即 4 字 节 ) 整数 ，s 表示 “ 短 ” 
( 即 4 字 节 ) 整数 。 昌 然 在 使 用 这 些 函数 时 包含 的 是 <arpa/inet .h> 头 文件 ,但 系统 实现 经 常 是 
在 其 他 头 文件 中 声明 这 些 函 数 的 ， 只 是 这 些 头 文件 都 包含 在 <arpa/inet .h> 中 。 对 于 系统 来 说 ， 
594] 把 这 些 函 数 实现 为 宏 也 是 很 常见 的 。 


16.3.2 ”地 址 格式 


-个 地 址 标识 一 个 特定 通信 域 的 套 接 字 端点 ， 地 址 格式 与 这 个 特定 的 通信 域 相关 。 为 使 不 同 
格式 地 址 能 够 传 入 到 套 接 字 函 数 ， 地 址 会 被 强制 转换 成 一 个 通用 的 地 址 结构 sockaddr: 


struct sockaddr { 
sa_family_t sa_family; /* address family */ 
char sa_data[]; /* variable-length address */ 


}; 
套 接 字 实 现 可 以 自由 地 添加 额外 的 成 员 并 且 定 义 sa data 成 员 的 大 小 。 例 如 ， 在 Linux 中 ， 该 
结构 定义 如 下 : 


struct sockaddr { 

sa_family_t sa_family; /* address family */ 

char sa_data[14]; /* variable-length address */ 
}; 


但 是 在 FreeBSD 中 ， 该 结构 定义 如 下 : 


struct sockaddr { 


unsigned char sa_len; /* total length */ 
sa_family_t sa_family; /* address family */ 
char sa_data[14]; /* variable-length address */ 


E 
因特网 地 址 定义 在 <netinet/in.h> 头 文件 中 。 在 IPv4 因特网 域 (AF_INET) 中 ， 套 接 字 
地 址 用 结构 sockaddr_in 表示 : 


struct in addr { 
in_addr_t s_ addr; /* IPv4 address */ 


}; 


struct sockaddr_in { 
sa_family_t sin_family; /* address family */ 
in_port_t sin_port; /* port number */ 
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struct in_addr sin_addr; /* IPv4 address */ 
Ve 
数据 类 型 in_port_t 定义 成 uint16_t。 数据 类 型 in_addr t 定义 成 uint32 t。 这 些 整数 类 
型 在 <stdint .h> 中 定义 并 指定 了 相应 的 位 数 。 
与 AF_INET 域 相 比较 ，IPv6 因特网 域 (AF_INET6) 套 接 字 地 址 用 结构 sockaddr_in6 Xm: 
struct_in6_addr { 
uint8 t s6 addr[16]; /* IPv6 address */ 
i 


struct sockaddr in6 { 


sa family t sin6 family; /* address family */ 

in port t sin6 port; /* port number */ 

uint32 t sin6 flowinfo; /* traffic class and flow info */ 
struct in6 addr sin6 addr; /* IPv6 address*/ 

uint32 t sin6 scope id; /* set of interfaces for scope */ 


}? 
这 些 都 是 Single UNIX Specification 要 求 的 定义 。 每 个 实现 可 以 自由 添加 更 多 的 字段 。 例 如 ， 在 
Linux 中 ，sockaddr_in 定义 如 下 : 


struct sockaddr in { 


sa family t sin_family; /* address family */ 
in_port_t sin_port; /* port number */ 
struct in6_addr sin6_addr; /* IPv4 address */ 
unsigned char sin zero[8]; /* filler */ 


其 中 成 员 sin_zero 为 填充 字段 ， 应 该 全 部 被 置 为 0。 

注意 ， 尽 管 sockaddr in 与 sockaddr in6 结构 相差 比较 大 ， 但 它们 均 被 强制 转换 成 
sockaddr 结构 输入 到 套 接 字 例 程 中 。 在 17.2 节 , 将 会 看 到 UNIX 域 套 接 字 地 址 的 结构 与 上 述 两 
个 因特网 域 套 接 字 地 址 格式 的 不 同 。 

有 了 时， 需要 打印 出 能 被 人 理解 而 不 是 计算 机 所 理解 的 地 址 格式 。BSD 网 络 软件 包含 函数 
inet addr 和 inet_ntoa， 用 于 二 进 制 地 址 格式 与 点 分 十 进 制 字 符 表示 (a.b.c.d) 之 间 的 相互 
转换 。 但 是 这 些 函 数 仅 适用 于 IPv4 地 址 。 有 两 个 新 函数 inet_ntop 和 inet_pton 具有 相似 的 
功能 ， 而 且 同 时 支持 IPv4 地 址 和 IPv6 地 址 。 


#include <arpa/inet.h> 


const char *inet_ntop(int domain, const void *restrict addr, 
char *restrict str, socklen_t size); 


返回 值 : 若 成 功 ， 返 回 地 址 字符 串 指针 ;， 若 出 错 ， 返 回 NULL 


int inet_pton(int domain, const char * restrict str, 
void *restrict addr); 





返回 值 : 若 成 功 ， 返 回 1; 若 格式 无 效 ， 返 回 0; 若 出 错 ， 返 回 -1 


函数 inet ntop 将 网 络 字 节 序 的 二 进 制 地 址 转换 成 文本 字符 串 格 式 。inet_pton 将 文本 字 
符 串 格式 转换 成 网 络 字 节 序 的 二 进 制 地 址 。 参 数 domain 仅 支 持 两 个 值 : AF_INET 和 AF_INET6。 

对 于 inet_ntop, BM size 指定 了 保存 文本 字符 串 的 缓冲 区 (str) 的 大 小 。 两 个 常数 用 于 
简化 工作 : INET ADDRSTRLEN 定义 了 足够 大 的 空间 来 存放 一 个 表示 IPv4 地 址 的 文本 字符 串 ; 
INET6 ADDRSTRLEN 定义 了 足够 大 的 空间 来 存放 一 个 表示 IPv6 地 址 的 文本 字符 串 。 对 于 
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inet_pton, 如 果 domain 是 AF_INET, 则 缓冲 区 addr 需要 足够 大 的 空间 来 存放 一 个 32 位 地 址 ， 
如 果 domain 是 AF_INET6， 则 需要 足够 大 的 空间 来 存放 一 个 128 位 地 址 。 


16.3.3 ”地 址 查询 


理想 情况 下 ， 应 用 程序 不 需要 了 解 一 个 套 接 字 地 址 的 内 部 结构 。 如 果 一 个 程序 简单 地 传递 一 
个 类 似 于 sockaddr 结构 的 套 接 字 地 址 ,并 且 不 依赖 于 任何 协议 相关 的 特性 ， 那么 可 以 与 提供 相 
同类 型 服务 的 许多 不 同 协议 协作 。 

历史 上 ，BSD 网 络 软件 提供 了 访问 各 种 网 络 配置 信息 的 接口 。6.7 节 简 要 讨论 了 网 络 数 据 
文件 和 用 来 访问 这 些 文 件 的 函数 。 本 节 将 更 详细 地 讨论 一 些 细节 ， 并 且 引 入 新 的 函数 来 查询 寻 
址 信息 。 

这 些 函 数 返 回 的 网 络 配置 信息 被 存放 在 许多 地 方 。 这 个 信息 可 以 存放 在 静态 文件 〈 如 
/etc/hosts 和 /etc/services) 中 ， 也 可 以 由 名 字 服 务 管理 ， 如 域名 系统 (Domain Name 
System, DNS) 或 者 网 络 信 息 服 务 (Network Information Service，NIS )。 无 论 这 个 信息 放 在 何 处 ， 
都 可 以 用 同样 的 函数 访问 它 。 

通过 调用 gethostent， 可 以 找到 给 定 计 算 机 系统 的 主机 信息 。 


#include <netdb.h> 





struct hostent *gethostent (void); 


返回 值 ， 若 成 功 ， 返 回 指针 ; 若 出 错 ， 返 回 NULL 


void sethostent (int stayopen) ; 


void endhostent (void); 


如 果 主 机 数据 库 文件 没有 打开 ，gethostent 会 打开 它 。 函 数 gethostent 返回 文件 中 的 下 一 
ASA. MM sethostent 会 打开 文件 ， 如 果 文 件 已 经 被 打开 ， 那 么 将 其 回 绕 。 当 stayopen 参数 设 
置 成 非 0 值 时 ， 调 用 gethostent 之 后 ， 文 件 将 依然 是 打开 的 。 函 数 endhostent 可 以 关闭 文件 。 

当 gethostent 返回 时 , 会 得 到 一 个 指向 hostent 结构 的 指针 ， 该 结构 可 能 包含 一 个 静态 
的 数据 缓冲 区 ， 每 次 调用 gethostent, 缓冲 区 都 会 被 覆盖 。hostent 结构 至 少 包含 以 下 成 员 : 


struct hostent{ 





char *h_name; /* name of host */ 
char **h aliases; /* pointer to alternate host name array */ 
int h_addrtype; /* address type */ 
int h_length; /* length in bytes of address */ 
char **h addr list; /* pointer to array of network addresses */ 
}; 
返回 的 地 址 采用 网 络 字 节 序 。 


另外 两 个 函数 gethostbyname 和 gethostbyaddr， 原 来 包含 在 hostent 函数 中 ， 现 在 
则 被 认为 是 过 时 的 。SUSv4 已 经 删除 了 它们 。 马 上 将 会 看 到 它们 的 替代 函数 。 
能 够 采用 一 套 相 似 的 接口 来 获得 网 络 名 字 和 网 络 编号 。 


#include <netdb.h> 


struct netent *getnetbyaddr (uint32_t met, int hype); 





struct netent *getnetbyname(const char *name) ; 
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struct netent *getnetent (void); 


3 个 函数 的 返回 值 : 车 成 功 ， 返 回 指针 ， 若 出 错 ， 返 回 NULL 


void setnetent (int stayopen) ; 


void endnetent (void) ; 


netent 结构 至 少 包含 以 下 字段 : 


struct netent { 





char *n name; /* network name */ 

char **n aliases; /* alternate network name array pointer */ 
int n addrtype; /* address type */ 

uint32 t n net; /* network number */ 


网 络 编号 按照 网 络 字 节 序 返 回 。 地 址 类 型 是 地 址 族 常量 之 一 〈 如 AF INET). 
我 们 可 以 用 以 下 函数 在 协议 名 字 和 协议 编号 之 间 进 行 映 射 。 
#include <netdb.h> 
struct protoent *getprotobyname(const char *name) ; 
struct protoent *getprotobynumber (int proto) ; 
struct protoent *getprotoent (void) ; 
3 个 函数 的 返回 值 ， 若 成 功 ， 返 回 指针 ; 若 出 错 ， 返 回 NULL 


void setprotoent (int stayopen) ; 





void endprotoent (void) ; 


POSIX.1 定义 的 protoent 结构 至 少 包含 以 下 成 员 : 


struct protoent { 


char *p name; /* protocol name */ 
char **p aliases; /* pointer to altername protocol name array */ 
int p.proto; /* protocol number */ 


he 
服务 是 由 地 址 的 端口 号 部 分 表示 的 。 每 个 服务 由 一 个 唯一 的 众所周知 的 端口 号 来 支持 。 可 以 
使 用 函数 getservbyname 将 一 个 服务 名 映射 到 一 个 端口 号 ， 使 用 函数 getservbyport 将 一 
个 端口 号 映射 到 一 个 服务 名 ， 使 用 函数 getservent 顺序 扫描 服务 数据 库 。 
#include <netdb.h> 
struct servent *getservbyname(const char *name, const char *proto) ; 
struct servent *getserbyport (int port, const char *proto) ; 


struct servent *getservent (void) ; 


3 个 函数 的 返回 值 : 车 成 功 ， 返 回 指针 ， 若 出 错 ， 返 回 NULL 


void setservent (int sfayopen); 





void endservent (void) ; 
servent 结构 至 少 包 含 以 下 成 员 : 


struct servent{ 
char  *s name; /* service name */ 
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char **s_aliases; /* pointer to alternate service name array */ 
int s_port; /* port number */ 


char *s_proto; /* name of protocol */ 


}; 

POSIX.1 定义 了 若干 新 的 函数 ， 允 许 一 个 应 用 程序 将 一 个 主机 名 和 一 个 服务 名 映射 到 一 个 地 
址 ， 或 者 反之 。 这 些 函 数 代 蔡 了 较 老 的 函数 gethostbyname 和 gethostbyaddr。 

getaddrinfo 函数 允许 将 一 个 主机 名 和 一 个 服务 名 映射 到 一 个 地 址 。 


#include <sys/socket.h> 


#include <netdb.h> 


int getaddrinfo(const char *restrict host, 
const char *restrict service, 
const struct addrinfo *restrict hint, 
struct addrinfo **restrict res); 


返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 非 0 错误 码 





void freeaddrinfo(struct addrinfo *ai); 


需要 提供 主机 名 、 服 务 名 ， 或 者 两 者 都 提供 。 如 果 仅 仅 提供 一 个 名 字 ， 另 外 一 个 必须 是 一 个 
空 指针 。 主 机 名 可 以 是 一 个 节点 名 或 点 分 格式 的 主机 地 址 。 
getaddrinfo 函数 返回 一 个 链表 结构 addrinfo。 可 以 用 freeaddrinfo 来 释放 一 个 或 
多 个 这 种 结构 ， 这 取决 于 用 ai_next 字段 链接 起 来 的 结构 有 多 少 。 
addrinfo 结构 的 定义 至 少 包含 以 下 成 员 : 


struct addrinfo { 


int ai_flags; /* customize behavior */ 

int ai_family; /* address family */ 

int ai_socktype; /* socket type */ 

int ai_protocol; /* protocol */ 

socklen t ai addrlen; /* length in bytes of address */ 
struct sockaddr *ai addr; /* address */ 

char *ai canonname; /* canonical name of host */ 


struct addrinfo *ai next; /* next in list */ 


E 

可 以 提供 一 个 可 选 的 hint 来 选择 符合 特定 条 件 的 地 址 。hint 是 一 个 用 于 过 滤 地 址 的 模板 ， 包 
括 ai_family、ai_flags、ai_protocol 和 ai_socktype 字段 。 剩 余 的 整数 字段 必须 设置 
为 0， 指针 字段 必须 为 空 。 图 16-7 总 结 了 ai flags 字段 中 的 标志 ， 可 以 用 这 些 标志 来 自 定 义 如 
何 处 理 地 址 和 名 字 。 
















查询 配置 的 地 址 类 型 (IPv4 或 IPv6) 
查找 IPv4 和 IPv6 地 址 ( 仅 用 于 AI_V4MAPPED) 
需要 一 个 规范 的 名 字 〔 与 别名 相对 ) 

以 数字 格式 指定 主机 地 址 ， 不 翻译 

将 服务 指定 为 数字 端口 号 ， 不 翻译 

套 接 字 地 址 用 于 监听 绑 定 

如 没有 找到 IPv6 地 址 ， 返 回 映射 到 IPv6 格式 的 IPv4 地 址 


图 16-7 addrinfo 结构 的 标志 









AI_ADDRCONFIG 
AI_ALL 
AI_CANONNAME 
AI_NUMERICHOST 
AI_NUMERICSERV 
AI_PASSIVE 
AI_V4MAPPED 
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如 果 getaddrinfo 失败 ， 不 能 使 用 perror 或 strerror 来 生成 错误 消息 ， 而 是 要 调用 
gai_strerror 将 返回 的 错误 码 转换 成 错误 消息 。 


#include <netdb.h> 





const char *gai_strerror(int error); 


返回 值 : 指向 描述 错误 的 字符 串 的 指针 
getnameinfo 函数 将 一 个 地 址 转换 成 一 个 主机 名 和 一 个 服务 名 。 


#include <sys/socket.h> 











#include <netdb.h> 


int getnameinfo(const struct sockaddr *restrict addr, socklen_t alen, 
char *restrict host, socklen_t hostlen, 
char *restrict service, socklen t serwen, int flags); 


返回 值 ， 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 非 0 值 


套 接 字 地 址 Caddr) 被 翻译 成 一 个 主机 名 和 一 个 服务 名 。 如 果 host 非 空 ， 则 指向 一 个 长 度 为 
hostlen 字 节 的 缓冲 区 用 于 存放 返回 的 主机 名 。 同样, 如 果 service 非 空 , 则 指向 一 个 长 度 为 servlen 
字 节 的 缓冲 区 用 于 存放 返回 的 主机 名 。 

flags 参数 提供 了 一 些 控制 翻译 的 方式 。 图 16-8 总 结 了 支持 的 标志 。 
















服务 基于 数据 报 而 非 基 于 流 
如 果 找 不 到 主机 名 ， 将 其 作为 一 个 错误 对 待 

对 于 本 地 主机 ， 仅 返回 全 限定 域名 的 节点 名 部 分 
返回 主机 地 址 的 数字 形式 ， 而 非 主 机 名 

对 于 IPv6， 返 回 范围 ID 的 数字 形式 ， 而 非 名 字 

返回 服务 地 址 的 数字 形式 〈 即 端口 号 )， 而 非 名 字 


图 16-8 getnameinfo 函数 的 标志 














NI_DGRAM 
NI_NAMEREQD 

NI NOFQDN 

NI NUMERICHOST 
NI NUMERICSCOPE 
NI NUMERICSERV 






= 实例 
| 
图 16-9 说 明了 getaddrinfo 函数 的 使 用 方法 。 


#include "apue.h" 

dif defined (SOLARIS) 
#include <netinet/in.h> 
#endif 

#include <netdb.h> 
#include <arpa/inet.h> 
#if defined (BSD) 
#include <sys/socket.h> 
#include <netinet/in.h> 
#endif 


void 
print_family (struct addrinfo *aip) 
{ 

printf (" family "); 

switch (aip->ai_family) { 

case AF_INET: 
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printf ("inet"); 
break; 

case AF_INET6: 
printf ("inet6"); 
break; 

case AF_UNIX: 
printf ("unix"); 
break; 

case AF_UNSPEC: 
printf ("unspecified") ; 
break; 

default: 
printf ("unknown") ; 


void 
print_type(struct addrinfo *aip) 
{ 
printf(" type "); 
switch (aip-»ai socktype) ( 
case SOCK STREAM: 
printf ("stream"); 
break; 
case SOCK DGRAM: 
printf ("datagram") ; 
break; 
case SOCK_SEQPACKET: 
printf ("seqpacket") ; 
break; 
case SOCK_RAW: 
printf ("raw"); 
break; 
default: 
printf ("unknown ($d)", aip->ai_socktype) ; 


void 
print_protocol (struct addrinfo *aip) 
{ 
printf(" protocol "); 
switch (aip->ai_protocol) { 
case 0: 
printf ("default"); 
break; 
case IPPROTO_TCP: 
printf ("TCP"); 
break; 
case IPPROTO_UDP: 
printf ("UDP"); 
break; 
case IPPROTO_RAW: 
printf ("raw"); 
break; 


default: 


printf ("unknown ($d)", aip-»ai protocol); 


void 
print flags(struct addrinfo *aip) 


{ 


int 


printf ("flags"); 
if (aip->ai_flags == 0) { 
print£f(" 0"); 
) else ( 
if (aip-»ai flags & AI PASSIVE) 
printf(" passive"); 
if (aip-»ai flags & AI CANONNAME) 
printf(" canon"); 
if (aip-»ai flags & AI NUMERICHOST) 
printf(" numhost"); 
if (aip-»ai flags & AI NUMERICSERV) 
printf(" numserv"); 
if (aip-»ai flags & AI VAMAPPED) 
printf(" v4mapped"); 
if (aip-»ai flags & AI ALL) 
printf(" all"); 


main(int argc, char *argv[]) 


{ 


struct addrinfo *ailist, *aip; 


struct addrinfo hint; 
struct sockaddr_in *sinp; 
const char *addr; 


int err; 
char abuf [INET_ADDRSTRLEN] ; 
if (argc != 3) 
err quit("usage: %s nodename service", argv[0]); 
hint.ai flags = AI, CANONNAME; 
hint.ai family = 0; 
hint.ai socktype = 0; 
hint.ai protocol - 0; 
hint.ai addrlen = 0; 
hint.ai canonname - NULL; 
hint.ai addr = NULL; 
hint.ai next - NULL; 


if ((err = getaddrinfo(argv[1], argv[2], &hint, &ailist)) 
err quit("getaddrinfo error: $s", gai strerror(err)); 


for (aip = ailist; aip != NULL; aip = aip-^ai next) 
print flags (aip); 
print family (aip); 
print type (aip); 
print protocol (aip); 


printf("\n\thost $s", aip-»ai canonname?aip-^ai canonname:"-"); 


{ 


!= 0) 
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603 if (aip->ai_family == AF_INET) { 
sinp = (struct sockaddr in *)aip->ai_addr; 
addr = inet_ntop(AF_INET, &sinp->sin_addr, abuf, 
INET_ADDRSTRLEN) ; 
printf(" address %s", addr?addr:"unknown"); 
printf(" port $d", ntohs(sinp->sin_port)); 
) 
printf ("Mn"); 
} 
exit (0); 


16-9 打印 主机 和 服务 信息 


这 个 程序 说 明了 getaddrinfo 函数 的 使 用 方法 。 如 果 有 多 个 协议 为 指定 的 主机 提供 给 定 的 服 
务 , 程序 会 打印 出 多 条 信息 。 本 实例 仅 打 印 了 与 IPv4 一 起 工作 的 那些 协议 Cai family 4 AF INET) 
的 地 址 信息 。 如 果 想 将 输出 限制 在 AF_INET 协议 族 ， 可 以 在 提示 中 设置 ai_family 字段 。 
在 一 个 测试 系统 上 运行 这 个 程序 时 ， 得 到 了 以 下 输出 : 
$ ./a.out harry nfs 
flags canon family inet type stream protocol TCP 
host harry address 192.168.1.99 port 2049 


flags canon family inet type datagram protocol UDP 
host harry address 192.168.1.99 port 2049 a 


16.3.4 “将 套 接 字 与 地 址 关联 


将 一 个 客户 端的 套 接 字 关联 上 一 个 地 址 没有 多 少 新 意 , 可 以 让 系统 选 一 个 默认 的 地 址 。 然而 ， 
对 于 服务 器 ， 需 要 给 一 个 接收 客户 端 请 求 的 服务 器 套 接 字 关联 上 一 个 众所周知 的 地 址 。 客 户 端 应 
有 一 种 方法 来 发 现 连接 服务 器 所 需要 的 地 址 ， 最 简单 的 方法 就 是 服务 器 保留 一 个 地 址 并 且 注 册 在 
/etc/services 或 者 某 个 名 字 服 务 中 。 

使 用 bind 函数 来 关联 地 址 和 套 接 字 。 


#include <sys/socket.h> 


int bind(int sockfd, const struct sockaddr *addr, socklen_t len); 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 





对 于 使 用 的 地 址 有 以 下 一 些 限制 。 
。 在 进程 正在 运行 的 计算 机 上 ， 指 定 的 地 址 必须 有 效 ; 不 能 指定 一 个 其 他 机 器 的 地 址 。 
604 。 地 址 必须 和 创建 套 接 字 时 的 地 址 族 所 支持 的 格式 相 匹 配 。 

。 地 址 中 的 端口 号 必须 不 小 于 1024， 除 非 该 进程 具有 相应 的 特权 〈 即 超级 用 户 )。 

。 一 般 只 能 将 一 个 套 接 字 端 点 绑 定 到 一 个 给 定 地 址 上 ， 尽 管 有 些 协议 允许 多 重 绑 定 。 

对 于 因特网 域 ， 如 果 指 定 IP 地 址 为 INADDR ANY (<netinet/in.h> 中 定义 的 )， 套 接 字 端 
点 可 以 被 绑 定 到 所 有 的 系统 网 络 接口 上 。 这 意味 着 可 以 接收 这 个 系统 所 安装 的 任何 一 个 网 卡 的 数 
据 包 。 在 下 一 节 中 可 以 看 到 ， 如 果 调 用 connect 或 1isten， 但 没有 将 地 址 绑 定 到 套 接 字 上 ， 
系统 会 选 一 个 地 址 绑 定 到 套 接 字 上 。 

可 以 调用 getsockname 函数 来 发 现 绑 定 到 套 接 字 上 的 地 址 。 
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#include <sys/socket.h> 


int getsockname(int sockfd, struct sockaddr *restrict addr, 


Socklen t *restrict alenp) ; 





返回 值 ， 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 
调用 getsockname 之 前 ,将 alenp 设置 为 一 个 指向 整数 的 指针 ， 该 整数 指定 缓冲 区 
sockaddr 的 长 度 。 返 回 时 ， 该 整数 会 被 设置 成 返回 地 址 的 大 小 。 如 果 地 址 和 提供 的 缓冲 区 长 
度 不 匹配 ， 地 址 会 被 自动 截断 而 不 报错 。 如 果 当 前 没有 地 址 绑 定 到 该 套 接 字 ， 则 其 结果 是 未 定 
如 果 套 接 字 已 经 和 对 等 方 连接 ， 可 以 调用 getpeername 函数 来 找到 对 方 的 地 址 。 
#include <sys/socket.h> 


int getpeername (int sockfd, struct sockaddr *restrict addr, 


socklen_t *restrict alenp) ; 





返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 
除了 返回 对 等 方 的 地 址 ， 函 数 getpeername 和 getsockname 一 样 。 


16.4 建立 连接 


如 果 要 处 理 一 个 面向 连接 的 网 络 服务 (SOCK STREAM 或 SOCK_SEOPRACKET )， 那 么 在 开始 
交换 数据 以 前 ， 需 要 在 请 求 服 务 的 进程 套 接 字 (客户 端 和 提供 服务 的 进程 套 接 字 〈 服 务 器 ) 之 
间 建 立 一 个 连接 。 使 用 connect 函数 来 建立 连接 。 


#include <sys/socket.h> 


int connect (int sockfd, const struct sockaddr *addr, socklen_t len); 


返回 值 ;: 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 | [605 





在 connect 中 指定 的 地 址 是 我 们 想 与 之 通信 的 服务 器 地 址 。 如 果 sockf4 没有 绑 定 到 一 个 地 
址 ，connect 会 给 调用 者 绑 定 一 个 默认 地 址 。 

当 尝 试 连接 服务 器 时 ， 出 于 一 些 原因 ， 连 接 可 能 会 失败 。 要 想 一 个 连接 请 求 成 功 ， 要 连接 的 
计算 机 必须 是 开启 的 ， 并 且 正 在 运行 ， 服 务 器 必须 绑 定 到 一 个 想 与 之 连接 的 地 址 上， 并且 服务 器 
的 等 待 连接 队列 要 有 足够 的 空间 (后 面 会 有 更 详细 的 介绍 )。 因 此 ， 应 用 程序 必须 能 够 处 理 
connect 返回 的 错误 ， 这 些 错 误 可 能 是 由 一 些 瞬时 条 件 引 起 的 。 


“KB 


图 16-10 显示 了 一 种 如 何 处 理 瞬 时 connect 错误 的 方法 。 如 果 一 个 服务 器 运行 在 一 个 负载 
很 重 的 系统 上 ， 就 很 有 可 能 发 生 这 些 错误 。 


#include "apue.h" 
#include <sys/socket.h> 











#define MAXSLEEP 128 


int 
connect_retry(int sockfd, const struct sockaddr *addr, socklen_t alen) 
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{ 


int numsec; 


/* 
* Try to connect with exponential backoff. 
+y 
for (numsec = 1; numsec <= MAXSLEEP; numsec <<= 1) { 
if (connect (sockfd, addr, alen) == 0) { 
/* 
* Connection accepted. 
bad 
return (0); 
} 
/* 
* Delay before trying again. 
if 


if (numsec <= MAXSLEEP/2) 
sleep (numsec) ; 
} 


return (-1); 


图 16-10 支持 重 试 的 connect 


这 个 函数 展示 了 指数 补偿 (exponential backoff) 算法 。 如 果 调 用 connect 失败 ， 进 程 会 休 

眠 一 小 段 时 间 ， 然 后 进入 下 次 循环 再 次 尝试 ， 每 次 循环 休眠 时 间 会 以 指数 级 增加 ， 直 到 最 大 延迟 
为 2 分 钟 左 右 。 

然而 图 16-10 中 的 代码 存在 一 个 问题 : 代码 是 不 可 移植 的 。 它 在 Linux 和 Solaris 上 可 以 工作 ， 
但 是 在 FreeBSD 和 Mac OS X 上 却 不 能 按 预期 工作 。 在 基于 BSD 的 套 接 字 实现 中 , 如 果 第 一 次 连 
接 尝试 失败 ， 那 么 在 TCP 中 继续 使 用 同一 个 套 接 字 描 述 符 ， 接 下 来 仍旧 会 失败 。 这 就 是 一 个 协议 
相关 的 行为 从 〈 协 议 无 关 的 ) 套 接 字 接 口中 显露 出 来 变 得 应 用 程序 可 见 的 例子 。 这 些 都 是 历史 原 
因 ， 因 此 Single UNIX Specification 和 警告， 如果 connect 失败 ， 套 接 字 的 状态 会 变 成 未 定义 的 。 

因此 ， 如 果 connect 失败 ， 可 迁移 的 应 用 程序 需要 关闭 套 接 字 。 如 果 想 重 试 ， 必 须 打 开 一 
个 新 的 套 接 字 。 这 种 更 易于 迁移 的 技术 如 图 16-11 所 示 。 


#include "apue.h" 
#include <sys/socket.h> 


#define MAXSLEEP 128 


int 
connect_retry(int domain, int type, int protocol, 

const struct sockaddr *addr, socklen_t alen) 
{ 


int numsec, fd; 


/* 
* Try to connect with exponential backoff. 
Xy 
for (numsec = 1; numsec <= MAXSLEEP; numsec ««- 1) ( 
if ((fd = socket(domain, type, protocol)) < 0) 
return(-1); 
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if (connect(fd, addr, alen) == 0) { 
/* 
* Connection accepted. 
bet 
return (fd); 
) 
close(fd); 
/* 
* Delay before trying again. 
xy 


if (numsec «- MAXSLEEP/2) 
sleep (numsec) ; 
} 
return(-1); 





图 16-11 可 迁移 的 支持 重 试 的 连接 代码 
需要 注意 的 是 ， 因 为 可 能 要 建立 一 个 新 的 套 接 字 , 给 connect_retry 函数 传递 一 个 套 接 字 
描述 符 参 数 是 没有 意义 。 我 们 现在 返回 一 个 已 连接 的 套 接 字 描述 符 给 调用 者 ， 而 并 非 返 回 一 个 表 
示 调 用 成 功 的 值 。 " 


如 果 套 接 字 描 述 符 处 于 非 阻 塞 模式 (该 模式 将 在 16.8 节 中 进一步 讨论 )， 那 么 在 连接 不 能 马 
上 建立 时 ，connect 将 会 返回 -1 并 且 将 errno 设置 为 特殊 的 错误 码 EINPROGRESS。 应 用 程序 
可 以 使 用 poll 或 者 select 来 判断 文件 描述 符 何 时 可 写 。 如 果 可 写 ， 连 接 完成 。 

connect 函数 还 可 以 用 于 无 连接 的 网 络 服务 (SOCK_DGRRAM)。 这 看 起 来 有 点 矛盾 ， 实 际 上 却 是 一 
个 不 错 的 选择 。 如果 用 SOCK_DGRAM 套 接 字 调 用 connect, 传送 的 报 文 的 目标 地 址 会 设置 成 connect 
调用 中 所 指定 的 地 址 , 这 样 每 次 传送 报 文 时 就 不 需要 再 提供 地 址 。 另外, 仅 能 接收 来 自 指 定 地 址 的 报 文 。 

服务 器 调用 listen 函数 来 宣告 它 愿意 接受 连接 请 求 。 


#include <sys/socket.h> 


int listen(int sockfd, int backlog) ; 








BR backlog 提供 了 一 个 提示 ， 提 示 系 统 该 进程 所 要 入 队 的 未 完成 连接 请 求 数量 。 其 实际 值 
由 系统 决定 ， 但 上 限 由 <sys/socket .h> 中 的 SOMAXCONN 指定 。 
Solaris 系统 忽略 了 <sys/socket.h> 中 的 SOMAXCONN。 具 体 的 最 大 值 取决 于 每 个 协议 的 实 
现 。 对 于 TCP， 其 默认 值 为 128。 


一 旦 队列 满 ， 系 统 就 会 拒绝 多 余 的 连接 请 求 ， 所 以 backlog 的 值 应 该 基于 服务 器 期 望 负载 和 
处 理 量 来 选择 ， 其 中 处 理 量 是 指 接受 连接 请 求 与 启动 服务 的 数量 。 

一 旦 服务 器 调用 了 1isten， 所 用 的 套 接 字 就 能 接收 连接 请 求 。 使 用 accept 函数 获得 连接 
请 求 并 建立 连接 。 
#include <sys/socket.h> 


int accept (int sockfd, struct sockaddr *restrict addr, 
socklen t *restrict len); 





返回 值 : 若 成 功 ， 返 回 文 件 〈 套 接 字 ) 描述 符 ; 若 出 错 ， 返 回 -1 
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函数 accept 所 返回 的 文件 描述 符 是 套 接 字 描 述 符 ， 该 描述 符 连 接 到 调用 connect 的 客户 
端 。 这 个 新 的 套 接 字 描 述 符 和 原始 套 接 字 (sockf4) 具有 相同 的 套 接 字 类 型 和 地 址 族 。 传 给 accept 
的 原始 套 接 字 没 有 关联 到 这 个 连接 ， 而 是 继续 保持 可 用 状态 并 接收 其 他 连接 请 求 。 

如 果 不 关心 客户 端 标 识 ， 可 以 将 参数 addr 和 len HHA NULL. AI, ZEW accept 之 前 ， 
将 addr 参数 设 为 足够 大 的 缓冲 区 来 存放 地 址 ， 并 且 将 /en 指向 的 整数 设 为 这 个 缓冲 区 的 字 节 大 小 。 
返回 时 ，accept 会 在 缓冲 区 填充 客户 端的 地 址 ， 并 且 更 新 指向 len 的 整数 来 反映 该 地 址 的 大 小 。 

如 果 没 有 连接 请 求 在 等 待 , accept 会 阻塞 直到 一 个 请 求 到 来 。 如 果 sockfd 处 于 非 阻 塞 模式 ， 
accept 会 返回 -1， 并 将 errno 设置 为 EAGAIN 或 EWOULDBLOCK. 


本 文中 讨论 的 所 有 平台 都 将 EAGAIN 定义 为 EWOULDBLOCK, 


如 果 服 务 器 调用 accept, 并且 当前 没有 连接 请 求 ， 服 务 器 会 阻塞 直到 一 个 请 求 到 来 。 另 外 ， 
服务 器 可 以 使 用 poll 或 select 来 等 待 一 个 请 求 的 到 来 。 在 这 种 情况 下 ， 一 个 带 有 等 待 连接 请 
求 的 套 接 字 会 以 可 读 的 方式 出 现 。 


“el 
图 16-12 显示 了 一 个 函数 ， 可 以 用 来 分 配 和 初始 化 套 接 字 供 服务 器 进程 使 用 。 


#include "apue.h" 
#include <errno.h> 
#include <sys/socket.h> 


int 
initserver(int type, const struct sockaddr *addr, socklen_t alen, 
int qlen) 
{ 
int fd; 
int err = 0; 


if ((fd = socket (addr->sa_family, type, 0)) < 0) 
return(-1); 

if (bind(fd, addr, alen) < 0) 
goto errout; 

if (type == SOCK STREAM || type == SOCK SEQPACKET) { 
if (listen(fd, qlen) < 0) 

goto errout; 
) 
return(fd); 


errout: 
err - errno; 
close(fd); 


errno - err; 
return(-1); 


图 16-12 初始 化 一 个 套 接 字 端点 供 服务 器 进程 使 用 
可 以 看 到 ，TCP 有 一 些 奇怪 的 地 址 复 用 规则 ， 这 使 得 这 个 例子 不 完备 。 图 16-22 显示 了 有 关 
这 个 函数 的 另 一 个 版 本 ， 可 以 绕 过 这 些 规则 ， 解 决 此 版 本 的 主要 缺陷 。 = 
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16.5 数据 传输 


既然 一 个 套 接 字 端 点 表示 为 一 个 文件 描述 符 , 那么 只 要 建立 连接 ,就 可 以 使 用 read 和 write 
来 通过 套 接 字 通信 。 回 忆 前 面 所 讲 ， 通 过 在 connect 函数 里 面 设置 默认 对 等 地 址 ， 数 据 报 套 接 
字 也 可 以 被 “连接 ” 在 套 接 字 描 述 符 上 使 用 read 和 write 是 非常 有 意义 的 ， 因 为 这 意味 着 可 
以 将 套 接 字 描 述 符 传递 给 那些 原先 为 处 理 本 地 文件 而 设计 的 函数 。 而 且 还 可 以 安排 将 套 接 字 描述 
符 传 递 给 子 进程 ， 而 该 子 进程 执行 的 程序 并 不 了 解 套 接 字 。 

尽管 可 以 通过 read 和 write 交换 数据 , 但 这 就 是 这 两 个 函数 所 能 做 的 一 切 。 如果 想 指 定 选 
项 ， 从 多 个 客户 端 接收 数据 包 ， 或 者 发 送 带 外 数据 ， 就 需要 使 用 6 个 为 数据 传递 而 设计 的 套 接 字 
函数 中 的 一 个 。 

3 个 函数 用 来 发 送 数 据 ，3 个 用 于 接收 数据 。 首 先 ， 考 查 用 于 发 送 数 据 的 函数 。 

最 简单 的 是 send， 它 和 write 很 像 ， 但 是 可 以 指定 标志 来 改变 处 理 传输 数据 的 方式 。 


#include <sys/socket.h> 





ssize_t send(int sockfd, const void *buf, size_t nbytes, int flags); 


返回 值 : 若 成 功 ， 返 回 发 送 的 字 节 数 ， 若 出 错 ， 返 回 -1 





类 似 write， 使 用 send 时 套 接 字 必 须 已 经 连接 。 参 数 buf 和 nbytes 的 含义 与 write 中 的 
然而 ， 与 write 不 同 的 是 ，send 支持 第 4 个 参数 flags. 3 个 标志 是 由 Single UNIX Specification 
定义 的 ， 但 是 具体 系统 实现 支持 其 他 标志 的 情况 也 是 很 常见 的 。 图 16-13 总 结 了 这 些 标志 。 


ss Linux | Mac OS 


usa CONFIRM | ieee | 
























p cw 

允许 非 阻 塞 操作 〈 等 价 于 使 用 
O_NONBLOCK) 

发 送 数据 后 关闭 套 接 字 的 发 送 端 

如 果 协 议 支 持 ， 标 记 记 录 结 束 

延迟 发 送 数 据 包 人 允许 写 更 多 数据 

在 写 无 连接 的 套 接 字 时 不 产生 
SIGPIPE 信号 

如 果 协 议 支持 ， 发 送 带 外 数据 
( 见 16.7 节 ) 


MSG_DONTROUTE 
MSG_DONTWAIT 









MSG_EOF 
MSG_EOR 
MSG_MORE 
MSG NOSIGNAL 














MSG OOB 


图 16-13 sena 套 接 字 调 用 标志 
即使 send 成 功 返 回 ， 也 并 不 表示 连接 的 另 一 端的 进程 就 一 定 接收 了 数据 。 我 们 所 能 保证 的 
只 是 当 send 成 功 返 回 时 ， 数 据 已 经 被 无 错误 地 发 送 到 网 络 驱动 程序 上 。 
对 于 支持 报 文 边界 的 协议 ， 如 果 尝 试 发 送 的 单个 报 文 的 长 度 超过 协议 所 支持 的 最 大 长 度 ， 那 
4 send 会 失败 ， 并 将 errno 设 为 EMSGSIZE。 对 于 字 节 流 协议 ，send 会 阻塞 直到 整个 数据 传 
输 完 成 。 函 数 sendto 和 send 很 类 似 。 区 别 在 于 sendto 可 以 在 无 连接 的 套 接 字 上 指定 一 个 
标 地址 。 
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#include <sys/socket.h> 


ssize t sendto(int sockfd, const void *buf, size_t nbytes, int flags, 
const struct sockaddr *destaddr, socklen t destlen) ; 





返回 值 : 若 成 功 ， 返 回 发 送 的 字 节 数 ， 若 出 错 ， 返 回 -1 


对 于 面向 连接 的 套 接 字 , 目标 地 址 是 被 忽略 的 , 因为 连接 中 隐 含 了 目标 地 址 。 对 于 无 连接 的 套 接 字 ， 
除非 先 调 用 connect 设置 了 目标 地 址 ， 否 则 不 能 使 用 send. sendato 提供 了 发 送 报 文 的 另 一 种 方式 。 

通过 套 接 字 发 送 数 据 时 ， 还 有 一 个 选择 。 可 以 调用 带 有 msghdr 结构 的 sendmsg 来 指定 多 
重 缓冲 区 传输 数据 ， 这 和 writev 函数 很 相似 〈 见 14.6 节 )。 


#include <sys/socket.h> 


ssize_t sendmsg (int 


POSIX.1 定义 了 m 


struct msghdr { 


void 
socklen_t 
struct iovec 
int 

void 


socklen_t 
int 


}; 


sockfd, const struct msghdr *msg, int flags); 
返回 值 : 若 成 功 ， 返 回 发 送 的 字 节 数 ， 考 出 错 ， 返 回 -1 
sghdr 结构 ， 它 至 少 有 以 下 成 员 : 





*msg_name; /* optional address */ 
msg_namelen; /* address size in bytes */ 
*msg_iov; /* array of I/O buffers */ 
msg_iovlen; /* number of elements in array */ 
*msg_control; /* ancillary data */ 
msg_controllen; /* number of ancillary bytes */ 
msg_flags; /* flags for received message */ 


在 14.6 节 中 可 以 看 到 iovec 结构 。 在 17.4 节 中 可 以 看 到 辅助 数据 的 使 用 。 
函数 recv 和 read 相似 ， 但 是 recy 可 以 指定 标志 来 控制 如 何 接收 数据 。 


#include <sys/socke 


ssize_t recv(int soc 


t.h» 


kfd, void *buf, size t nbytes, int flags); 





返回 值 ， 返 回 数据 的 字 节 长 度 ， 若 无 可 用 数据 或 对 等 方 已 经 按 序 结束 ， 返 回 0， 若 出 错 ， 返 回 -1 
图 16-14 总 结 了 这 些 标志 。 仅 有 3 个 标志 是 Single UNIX Specification 定义 的 。 


| MSG cMsc CLOEXEC | 


MSG DONTWAIT 


MSG ERRQUEUE 


MSG OOB 


MSG PEEK 


MSG TRUNC 


MSG WAITALL 


| 为 UNIX 域 套 接 字 上 接收 的 | 
文件 描述 符 设置 执行 时 关闭 标 
a CML 17.4 45) 

启用 非 阻塞 操作 〈 相 当 于 使 
用 O_NONBLOCK) 

接收 错误 信息 作为 辅助 数据 
如 果 协 议 支 持 ， 获 取 带 外 数 
# (WL 16.7 节 ) 

返回 数据 包 内容 而 不 真正 取 
走 数 据 包 

即使 数据 包 被 截断 ， 也 返回 
数据 包 的 实际 长 度 

等 待 直到 所 有 的 数据 可 用 ( 仅 
SOCK STREAM) 


图 16-14 recv 套 接 字 调 用 标志 
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当 指 定 MSG_PEEK 标志 时 ， 可 以 查看 下 一 个 要 读 取 的 数据 但 不 真正 取 走 它 。 当 再 次 调用 read 
或 其 中 一 个 recv 函数 时 ， 会 返回 刚才 查看 的 数据 。 

对 于 SOCK_STREAM 套 接 字 ， 接 收 的 数据 可 以 比 预 期 的 少 。MSG_WAITRALL 标志 会 阻止 这 种 
行为 , 直到 所 请 求 的 数据 全 部 返回 , recv 函数 才 会 返回 。 对 于 SOCK_DGRAM 和 SOCK_SEQPACKET 
EKF, MSG WAITALL 标志 没有 改变 什么 行为 ， 因 为 这 些 基于 报 文 的 套 接 字 类 型 一 次 读 取 就 返 
回 整 个 报 文 。 

如 果 发 送 者 已 经 调用 shutdown (A 16.2 节 ) 来 结束 传输 ， 或 者 网 络 协议 支持 按 默认 的 顺序 
关闭 并 且 发 送 端 已 经 关闭 ， 那 么 当 所 有 的 数据 接收 完毕 后 ，recv 会 返回 0。 

如 果 有 兴趣 定位 发 送 者 ， 可 以 使 用 recvfrom 来 得 到 数据 发 送 者 的 源 地 址 。 


#include <sys/socket.h> 











ssize t recvfrom(int sockfd, void *restrict buf, size t len, int flags, 
struct sockaddr *restrict addr, 
socklen t *restrict addrlen) ; 


返回 值 : 返回 数据 的 字 节 长 度 ; 若 无 可 用 数据 或 对 等 方 已 经 按 序 结束 ， 返 回 0; 若 出 错 ， 返 回 -1 

如 果 addr 非 空 ， 它 将 包含 数据 发 送 者 的 套 接 字 端点 地 址 。 当 调用 recvfrom 时 ， 需 要 设置 
addrlen 参数 指向 一 个 整数 ， 该 整数 包含 addr 所 指向 的 套 接 字 缓 冲 区 的 字 节 长 度 。 返 回 时 ， 该 整 
数 设 为 该 地 址 的 实际 字 节 长 度 。 

因为 可 以 获得 发 送 者 的 地 址 ，recvfrom 通常 用 于 无 连接 的 套 接 字 。 否 则 ，recvfrom 等 同 
T recv. 

为 了 将 接收 到 的 数据 送 入 多 个 缓冲 区 ， 类 似 于 readv (A 14.6 节 )， 或 者 想 接 收 辅助 数据 
CH 17.4 节 )， 可 以 使 用 recvmsg。 











#include <sys/socket.h> 


ssize t recvmsg(int sockfd, struct msghdr *msg, int flags); 


返回 值 : 返回 数据 的 字 节 长 度 ， 若 无 可 用 数据 或 对 等 方 已 经 按 序 结束 ， 返 回 0， 若 出 错 ， 返 回 -1 





recvmsg H] msghdr 结构 (在 sendmsg 中 见 到 过 ) 指定 接收 数据 的 输入 缓冲 区 。 可 以 设置 
参数 flags 来 改变 recvmsg 的 默认 行为 。 返 回 时 ，msghdr 结构 中 的 msg_flags 字段 被 设 为 所 
接收 数据 的 各 种 特征 。( 进 入 recvmsg 时 msg_flags WAK.) recvmsg 中 返回 的 各 种 可 能 值 
总 结 在 图 16-15 中 。 我 们 将 在 第 17 章 看 到 使 用 recvmsg 的 实例 。 


FreeBSD 3 Mac OS Solaris 


一 般 数据 被 截断 HH M 


图 16-15 从 recvmsg 中 返回 的 msg_flags 标志 


实例 : 面向 连接 的 客户 端 
_ ——. 
图 16-16 显示 了 一 个 与 服务 器 通信 的 客户 端 从 系统 的 uptime 命令 获得 和 输出。 我 们 把 这 个 服 
务 称 为 “远程 正常 运行 时 间 ”(remote uptime)〈 简 写 为 “ruptime”)。 







标志 描述 POSIX.1 




















控制 数据 被 截断 






MSG_CTRUNC 











MSG_EOR 接收 记录 结束 符 
MSG_ERROUEUE | 接收 错误 信息 作为 辅助 数据 
MSG_OOB 接收 带 外 数据 






MSG_TRUNC 
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#include "apue.h" 
#include <netdb.h> 
#include <errno.h> 
#include <sys/socket.h> 


#define BUFLEN 128 


extern int connect_retry(int, int, int, const struct sockaddr *, 
socklen_t); 


void 
print_uptime(int sockfd) 
{ 

int n; 

char buf [BUFLEN] ; 


while ((n = recv(sockfd, buf, BUFLEN, 0)) > 0) 
write(STDOUT FILENO, buf, n); 

TE (n « 9) 
err sys("recv error"); 


int 

main(int argc, char *argv[]) 

{ 
struct addrinfo *ailist, *aip; 
struct addrinfo hint; 
int sockfd, err; 


if (arge != 2) 

err_quit ("usage: ruptime hostname") ; 
memset (&hint, 0, sizeof (hint) ); 
hint.ai_socktype = SOCK_STREAM; 
hint.ai_canonname = NULL; 
hint.ai addr = NULL; 
hint.ai next = NULL; 


if ((err = getaddrinfo(argv[1], "ruptime", &hint, &ailist)) != 0) 
err quit("getaddrinfo error: $s", gai strerror(err)); 
for (aip = ailist aip != NULL; aip = aip-»ai next) { 


if ((sockfd = connect retry(aip-»ai family, SOCK STREAM, 0, 
aip-»ai addr, aip-»ai addrlen)) < 0) { 


err = errno; 

) else { 
print uptime (sockfd); 
exit(0); 


} 


err exit(err, "can't connect to %s", argv[1]); 


FA 16-16 用 于 从 服务 器 获取 正常 运行 时 间 的 客户 端 命令 
这 个 程序 连接 服务 器 ， 读 取 服 务 器 发 送 过 来 的 字符 串 并 将 其 打印 到 标准 输出 。 因 为 使 用 的 是 
SOCK STREAM 套 接 字 ， 所 以 不 能 保证 调用 一 次 recv 就 会 读 取 整个 字符 串 ， 因 此 需要 重复 调用 
直到 它 返 回 0。 
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如 果 服 务 器 支持 多 重 网 络 接口 或 多 重 网 络 协议 ， 函数 getaddrinfo 可 能 会 返回 多 个 候选 地 
址 供 使 用 。 轮 流 尝 试 每 个 地 址 ， 当 找到 一 个 允许 连接 到 服务 的 地 址 时 便 可 停止 。 使 用 图 16-11 中 
的 connect_retry 函数 来 与 服务 器 建立 一 个 连接 。 m 


a XP: 面向 连接 的 服务 器 
图 16-17 展示 了 服务 器 程序 ， 用 来 提供 uptime 命令 的 输出 到 图 16-16 所 示 的 客户 端 程序 。 


#include "apue.h" 
#include <netdb.h> 
#include <errno.h> 
#include <syslog.h> 
#include <sys/socket.h> 


#define BUFLEN 128 
#define QLEN 10 


#ifndef HOST NAME MAX 
#define HOST NAME MAX 256 
fendif 


extern int initserver(int, const struct sockaddr *, socklen t, int); 
void 


serve(int sockfd) 


{ 


int clfd; 
FILE "fn 
char buf [BUFLEN] ; 


set cloexec(sockfd); 
for (ur 
if ((clfd = accept(sockfd, NULL, NULL)) < 0) { 
Syslog(LOG ERR, "ruptimed: accept error: %s", 
strerror(errno)); 
exit (1): 
) 
set cloexec(clfd); 
if ((fp = popen("/usr/bin/uptime", "r")) == NULL) { 
sprintf(buf, "error: %s\n", strerror(errno)); 
send(clfd, buf, strlen(buf), 0); 
) else ( 
while (fgets(buf, BUFLEN, fp) !- NULL) 
send(clfd, buf, strlen(buf), 0); 
pclose(fp); 
) 
close(clfd); 


int 
main(int argc, char *argv[]) 
{ 


struct addrinfo *ailist, *aip; 
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struct addrinfo hint; 

int sockfd, err, n; 
char *host; 

if (arge !- 1) 


err quit("usage: ruptimed"); 
if ((n = sysconf( SC HOST NAME MAX)) < 0) 
n = HOST NAME MAX; /* best guess */ 
if ((host = malloc(n)) == NULL) 
err sys("malloc error"); 
if (gethostname(host, n) < 0) 
err sys("gethostname error"); 
daemonize ("ruptimed"); 
memset(&hint, 0, sizeof(hint)); 
hint.ai flags = AI CANONNAME; 
hint.ai socktype - SOCK STREAM; 
hint.ai canonname - NULL; 
hint.ai addr = NULL; 
hint.ai next - NULL; 
if ((err = getaddrinfo(host, "ruptime", &hint, &ailist)) != 0) { 
syslog (LOG_ERR, "ruptimed: getaddrinfo error: %s", 
gai strerror(err)); 
exit(1); 
} 
for (aip = ailist; aip != NULL; aip = aip->ai_next) { 
if ((sockfd = initserver(SOCK STREAM, aip->ai_addr, 
aip->ai_addrlen, QLEN)) >= 0) { 
serve (sockfd) ; 
exit (0); 
} 
} 
exit (1); 


图 16-17 提供 系统 正常 运行 时 间 的 服务 器 程序 

为 了 找到 它 的 地 址 ， 服 务 器 需要 获得 其 运行 时 的 主机 名 。 如 果 主 机 名 的 最 大 长 度 不 确定 ， 可 
以 使 用 HOST NAME MAX 代替 。 如 果 系 统 没 定义 HOST_NAME_MAX， 可 以 自己 定义 。POSIX.1 要 
求 主 机 名 的 最 大 长 度 至 少 为 255 字 节 ， 不 包括 终止 null 字符 ， 因 此 定义 HOST. NAME MAX 为 256 
来 包括 终止 null 字符 。 

服务 器 调用 gethostname 获得 主机 名 ， 查 看 远程 正常 运行 时 间 服 务 的 地 址 。 可 能 会 有 多 个 
地 址 返回 ， 但 我 们 简单 地 选择 第 一 个 来 建立 被 动 套 接 字 端 点 ( 即 一 个 只 用 于 监听 连接 请 求 的 地 
址 )。 处 理 多 个 地 址 作为 习题 留 给 读者 。 

使 用 图 16-12 的 initserver 函数 来 初始 化 套 接 字 端 点 ， 在 这 个 端点 上 等 待 到 来 的 连接 请 求 。 
(实际 上 ， 使 用 的 是 图 16-22 的 版 本 ; 在 16.6 节 中 讨论 套 接 字 选 项 时 ， 可 以 了 解 其 中 的 原因 。) m 


下 实例 : 男 一 个 面向 连接 的 服务 器 

前 面 说 过 ， 采 用 文件 描述 符 来 访问 套 接 字 是 非常 有 意义 的 ， 因 为 它 允 许 程 序 对 联网 环境 的 网 
络 访问 一 无 所 知 。 图 16-18 中 所 示 的 服务 器 程序 版 本 说 明了 这 一 点 。 服 务 器 没有 从 uptime 命令 
中 读 取 输出 并 发 送 到 客户 端 ， 而 是 将 uptime 命令 的 标准 输出 和 标准 错误 安排 成 为 连接 到 客户 端 


的 套 接 字 端 点 。 


#include 
#include 
#include 
#include 
#include 
#include 
#include 


"apue.h" 
«netdb.h» 
<errno.h> 
<syslog.h> 
«fcntl.h» 
«sys/socket.h» 
«sys/wait.h» 


#define QLEN 10 


#ifndef HOST NAME MAX 
#define HOST NAME MAX 256 
#endif 


extern int initserver(int, 


void 

serve(int sockfd) 

{ 

elfd; 
pid; 


int status; 


pid t 


set cloexec(sockfd); 


for (;;) { 


if ((clfd = accept(sockfd, NULL, 
syslog(LOG ERR, 


const struct sockaddr *, socklen t, int); 


NULL)) < 0) ( 


strerror(errno)); 


exit(1); 
} 


if ((pid = fork()) 


syslog (LOG_ERR, 


strerror (errno) ); 


exit (1); 


} else if (pid == 0) 


/* 


* The parent called daemonize 
* STDIN_FILENO, 


"ruptimed: accept error: %s", 
sna 
"ruptimed: fork error: %s", 
(/* child *7/ 
(Figure 13.1), so 


STDOUT FILENO, and STDERR FILENO 


) else ( 


* are already open to /dev/null. Thus, the call to 

* close doesn't need to be protected by checks that 

* clfd isn't already equal to one of these values. 

ay 

if (dup2(clfd, 

dup2(clfd, STDERR_FILENO) 
syslog(LOG_ERR, "ruptimed: 
exit(1); 


STDOUT_FILENO) != STDOUT_FILENO || 
!= STDERR FILENO) { 
unexpected error"); 


} 

close (clfd); 
execl ("/usr/bin/uptime", 
syslog(LOG_ERR, "ruptimed: 

strerror(errno) ); 

/* parent */ 
close (clfd); 
waitpid(pid, 


"uptime", (char *)0); 


&status, 0); 


unexpected return from exec: 
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int 
main(int argc, char *argv[]) 
{ 


struct addrinfo ‘allist, *aip; 


struct addrinfo hint; 

int sockfd, err, n; 
char *host; 

if (argc != 1) 


err quit("usage: ruptimed"); 
if ((n = sysconf( SC HOST NAME MAX)) < 0) 
n - HOST NAME MAX; /* best guess */ 
if ((host = malloc(n)) == NULL) 
err sys("malloc error"); 
if (gethostname (host, n) < 0) 
err sys("gethostname error"); 
daemonize ("ruptimed"); 
memset(&hint, 0, sizeof(hint)); 
hint.ai flags = AI CANONNAME; 
hint.ai socktype - SOCK STREAM; 
hint.ai canonname - NULL; 
hint.ai addr = NULL; 
hint.ai next = NULL; 
if ((err = getaddrinfo(host, "ruptime", &hint, &ailist)) !- 0) { 
syslog (LOG ERR, "ruptimed: getaddrinfo error: %s", 
gai strerror(err)); 
exit(1); 
) 
for (aip = ailist; aip != NULL; aip = aip-»ai next) { 
if ((sockfd = initserver(SOCK STREAM, aip->ai_addr, 
aip-»ai addrlen, QLEN)) >= 0) ( 
serve (sockfd) ; 
exit (0); 
} 
} 
exit (1); 


图 16-18 用 于 说 明 命令 直接 写 到 套 接 字 的 服务 器 程序 

我 们 没有 采用 popen 来 运行 uptime 命令 ， 并 从 连接 到 命令 标准 输出 的 管道 读 取 输 出 ， 而 是 
XH fork 创建 了 一 个 子 进程 , 然后 使 用 dup2 使 STDIN FILENO 的 子 进程 副本 对 /dev/null F 
jk, fii STDOUT_FILENO 和 STDERR FILENO 的 子 进程 副本 对 套 接 字 端点 开放 。 当 执行 uptime 
时 ， 命 令 将 结果 写 到 它 的 标准 输出 ， 该 标准 输出 是 连接 到 套 接 字 的 ， 所 以 数据 被 送 到 ruptime 客 
户 端 命令 。 

父 进程 可 以 安全 地 关闭 连接 到 客户 端的 文件 描述 符 ， 因 为 子 进 程 仍旧 让 它 打开 着 。 父 进程 会 
等 待 子 进程 处 理 完毕 再 继续 ， 所 以 子 进程 不 会 变 成 伪 死 进程 。 由 于 运行 uptime 命令 不 会 花费 太 
长 的 时 间 ， 所 以 父 进程 在 接受 下 一 个 连接 请 求 之 前 ， 可 以 等 待 子 进程 退出 。 然 而 ， 如 果子 进程 运 
行 的 时 间 比 较 长 的 话 ， 这 种 策略 就 未 必 适 合 了 。 a 
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前 面 的 实例 采用 的 都 是 面向 连接 的 套 接 字 。 但 如 何 选择 合适 的 套 接 字 类 型 呢 ? 何 时 采用 面 
向 连接 的 套 接 字 ， 何 时 采用 无 连接 的 套 接 字 呢 ? 答案 取决 于 我 们 要 做 的 工作 量 和 能 够 容忍 的 出 
错 程度 。 

对 于 无 连接 的 套 接 字 ， 数 据 包 到 达 时 可 能 已 经 没有 次 序 ， 因 此 如 果 不 能 将 所 有 的 数据 放 在 一 
个 数据 包 里 ， 则 在 应 用 程序 中 就 必须 关心 数据 包 的 次 序 。 数 据 包 的 最 大 尺寸 是 通信 协议 的 特征 。 
另外 ， 对 于 无 连接 的 套 接 字 ， 数 据 包 可 能 会 丢失 。 如 果 应 用 程序 不 能 容忍 这 种 丢失 ， 必 须 使 用 面 
向 连接 的 套 接 字 。 

容忍 数据 包 丢 失意 味 着 两 种 选择 。 一 种 选择 是 ， 如 果 想 和 对 等 方 可 靠 通信 ， 就 必须 对 数据 包 
编号 ， 并 且 在 发 现 数据 包 丢失 时 ， 请 求 对 等 应 用 程序 重 传 ， 还 必须 标识 重复 数据 包 并 丢弃 它们 ， 
因为 数据 包 可 能 会 延迟 或 疑似 丢失 ， 可 能 请 求 重 传 之 后 ， 它 们 又 出 现 了 。 [619] 

另 一 种 选择 是 ， 通 过 让 用 户 再 次 尝试 那个 命令 来 处 理 错误 。 对 于 简单 的 应 用 程序 ， 这 可 能 就 
足够 了 ， 但 对 于 复杂 的 应 用 程序 ， 这 种 选择 通常 不 可 行 。 因 此 ， 一 般 在 这 种 情况 下 使 用 面向 连接 
的 套 接 字 比较 好 。 

面向 连接 的 套 接 字 的 缺陷 在 于 需要 更 多 的 时 间 和 工作 来 建立 一 个 连接 ， 并 且 每 个 连接 都 需要 
消耗 较 多 的 操作 系统 资源 。 


有 实例 : 无 连接 的 客户 端 
图 16-19 中 的 程序 是 采用 数据 报 套 接 字 接口 的 uptime 客户 端 命令 版 本 。 


#include "apue.h" 
#include <netdb.h> 
#include <errno.h> 
#include <sys/socket.h> 


#define BUFLEN 128 
#define TIMEOUT 20 
void 


sigalrm(int signo) 
{ 
} 


void 
print_uptime(int sockfd, struct addrinfo *aip) 
{ 


int n; 
char buf [BUFLEN] ; 
buf[0] = 0; 


if (sendto(sockfd, buf, 1, 0, aip->ai_addr, aip-»ai addrlen) < 0) 
err sys("sendto error"); 
alarm (TIMEOUT); 
if ((n = recvfrom(sockfd, buf, BUFLEN, 0, NULL, NULL)) < 0) | 
if (errno != EINTR) 
alarm(0); 
err sys("recv error"); 
} 
alarm(0); 
write(STDOUT FILENO, buf, n); 
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} 


int 
main(int argc, char *argv[]) 
{ 


struct addrinfo *ailist, *aip; 
struct addrinfo hint; 

int sockfd, err; 
struct sigaction sa; 


if (argc != 2) 
err quit("usage: ruptime hostname"); 

sa.sa handler = sigalrm; 

sa.sa flags = 0; 

sigemptyset(&sa.sa mask); 

if (sigaction(SIGALRM, &sa, NULL) < 0) 
err sys("sigaction error"); 

memset(&hint, 0, sizeof(hint)); 

hint.ai socktype = SOCK DGRAM; 

hint.ai canonname - NULL; 

hint.ai addr = NULL; 

hint.ai next - NULL; 

if ((err = getaddrinfo(argv[1], "ruptime", &hint, &ailist)) !- 0) 
err quit("getaddrinfo error: %s", gai strerror(err)); 


for (aip = ailist; aip != NULL; aip = aip-»ai next) { 
if ((sockfd = socket(aip-»ai family, SOCK DGRAM, 0)) < 0) ( 
err - errno; 


) else ( 
print uptime(sockfd, aip); 
exit (0); 


) 


fprintf(stderr, "can't contact $s: %s\n", argv[1], strerror(err)); 
exit(1); 


图 16-19 ”采用 数据 报 服务 的 客户 端 命令 

除了 增加 安装 一 个 SIGALRM 的 信号 处 理 程序 以 外 ， 基 于 数据 报 的 客户 端 中 的 main 函数 和 
面向 连接 的 客户 端 中 的 类 似 。 使 用 alarm 函数 来 避免 调用 recvfrom 时 的 无 限期 阻塞 。 

对 于 面向 连接 的 协议 ， 需 要 在 交换 数据 之 前 连接 到 服务 器 。 对 于 服务 器 来 说 ， 到 来 的 连 
接 请 求 已 经 足够 判断 出 所 需 提 供给 客户 端的 服务 。 但 是 对 于 基于 数据 报 的 协议 ， 需 要 有 一 种 
方法 通知 服务 器 来 执行 服务 。 本 例 中 ， 只 是 简单 地 向 服务 器 发 送 了 1 字 节 的 数据 。 服 务 器 将 
接收 它 ， 从 数据 包 中 得 到 地 址 ， 并 使 用 这 个 地 址 来 传送 它 的 响应 。 如 果 服 务 器 提供 多 个 服务 ， 
可 以 使 用 这 个 请 求 数据 来 表示 需要 的 服务 , 但 由 于 服务 器 只 做 一 件 事情 ，! 字 节 数据 的 内 容 是 
无 关 紧 要 的 。 

如 果 服 务 器 不 在 运行 状态 ,客户 端 调 用 recvfrom 便 会 无 限期 阻塞 。 对 于 这 个 面向 连接 的 实 
例 ， 如 果 服 务 器 不 运行 ，connect 调用 会 失败 。 为 了 避免 无 限期 阻塞 ， 可 以 在 调用 recvfrom 

之 前 设置 警告 时 钟 。 a 





m K: 无 连接 的 服务 器 
图 16-20 所 示 的 程序 是 uptime 服务 器 的 数据 报 版 本 。 


#include "apue.h" 
#include <netdb.h> 
#include <errno.h> 





#include <syslog.h> 
#include <sys/socket.h> 


#define BUFLEN 128 
#define MAXADDRLEN 256 


#ifndef HOST_NAME_MAX 
#define HOST NAME MAX 256 
#fendif 


extern int initserver(int, const struct sockaddr *, socklen_t, 


void 
serve (int sockfd) 


{ 


int n; 

socklen_t alen; 

FILE *fp; 

char buf [BUFLEN] ; 

char abuf [MAXADDRLEN] ; 

struct sockaddr *addr = (struct sockaddr *)abuf; 


set cloexec(sockfd); 
for (;;) { 
alen = MAXADDRLEN; 


if ((n = recvfrom(sockfd, buf, BUFLEN, 0, addr, &alen)) < 0) 


syslog(LOG_ERR, "ruptimed: recvfrom error: %s", 
strerror (errno) ); 
exit(1); 
} 
if ((fp = popen("/usr/bin/uptime", "r")) == NULL) { 
sprintf (buf, "error: s\n", strerror(errno)); 
sendto(sockfd, buf, strlen(buf), 0, addr, alen); 
) else { 
if (fgets(buf, BUFLEN, fp) !- NULL) 


sendto(sockfd, buf, strlen(buf), 0, addr, alen); 


pclose(fp); 


int 

main(int argc, char *argv[]) 

{ 
struct addrinfo *ailist, *aip; 
struct addrinfo hint; 
int sockfd, err, n; 


{ 
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char *host; 


if (argc != 1) 
err quit("usage: ruptimed"); 
if ((n = sysconf( SC HOST NAME MAX)) < 0) 
n = HOST NAME MAX; /* best guess */ 
if ((host = malloc(n)) == NULL) 
err sys("malloc error"); 
if (gethostname(host, n) « 0) 
err sys("gethostname error"); 
daemonize ("ruptimed"); 
memset(&hint, 0, sizeof(hint)); 
hint.ai flags = AI CANONNAME; 
hint.ai socktype = SOCK DGRAM; 
hint.ai canonname = NULL; 
hint.ai addr = NULL; 
hint.ai next - NULL; 
if ((err = getaddrinfo(host, "ruptime", &hint, &ailist)) != 0) { 
syslog (LOG ERR, "ruptimed: getaddrinfo error: %s", 
gai strerror(err)); 
exit (1); 
} 
for (aip = ailist; aip != NULL; aip = aip->ai_next) { 
if ((sockfd = initserver(SOCK DGRAM, aip->ai_addr, 
aip->ai_addrlen, 0)) >= 0) { 
serve (sockfd); 
exit (0); 
} 
} 
exit (1); 


图 16-20 ”基于 数据 报 提供 系统 正常 运行 时 间 的 服务 器 
服务 器 在 recvfrom 阻塞 等 待 服务 请 求 。 当 一 个 请 求 到 达 时 , 保存 请 求 者 地 址 并 使 用 popen Kiz 
ff uptime 命令 。 使 用 sendto 函数 将 输出 发 送 到 客户 端 ， 将 目标 地 址 设置 成 刚才 的 请 求 者 地 址 。 m 
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套 接 字 机 制 提供 了 两 个 套 接 字 选项 接口 来 控制 套 接 字 行 为 。 一 个 接口 用 来 设置 选项 ， 另 一 个 
接口 可 以 查询 选项 的 状态 。 可 以 获取 或 设置 以 下 3 种 选项 。 

(OD 通用 选项 ， 工 作 在 所 有 套 接 字 类 型 上 。 

(2) 在 套 接 字 层次 管理 的 选项 ， 但 是 依赖 于 下 层 协议 的 支持 。 

(3) 特定 于 某 协 议 的 选项 ， 每 个 协议 独 有 的 。 

Single UNIX Specification 定义 了 套 接 字 层 的 选项 (上 述 选 项 中 的 前 两 个 选项 类 型 )。 

可 以 使 用 setsockopt 函数 来 设置 套 接 字 选项 。 


#include <sys/socket.h> 


int setsockopt (int sockfd, int level, int option, const void *val, 


socklen_t len); 





返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 
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参数 level 标识 了 选项 应 用 的 协议 。 如 果 选 项 是 通用 的 套 接 字 层次 选项 ， 则 level 设置 成 
SOL SOCKET. fill], level 设置 成 控制 这 个 选项 的 协议 编号 。 对 于 TCP XJ, level 是 IPPROTO_TCP, 
XJF IP, level 是 IPPROTO_IP。 图 16-21 总 结 了 Single UNIX Specification 中 定义 的 通用 套 接 字 


SO_ACCEPTCONN i 返回 信息 指示 该 套 接 字 是 否 能 被 监听 ( 仅 getsockopt) 
SO_BROADCAST i 如 果 *val 非 0， 广 播 数 据 报 

SO_DEBUG i 如 果 *val 非 0， 启 用 网 络 驱动 调试 功能 
SO_DONTROUTE i 如 果 *val 非 0， 绕 过 通常 路 由 

SO_ERROR i 返回 挂 起 的 套 接 字 错 误 并 清除 ( 仅 getsockopt) 
SO_KEEPALIVE i 如 果 *val 非 0， 启 用 周期 性 keep-alive 报 文 
SO_LINGER 当 还 有 未 发 报 文 而 套 接 字 已 关闭 时 ， 延 迟 时 间 

SO OOBINLINE i 如 果 *val 非 0， 将 带 外 数据 放 在 普通 数据 中 
SO_RCVBUF i 接收 缓冲 区 的 字 节 长 度 

SO_RCVLOWAT i 接收 调用 中 返回 的 最 小 数据 字 节 数 
SO_RCVTIMEO struct timeval | 套 接 字 接 收 调用 的 超时 值 

SO REUSEADDR int 如 果 *val 非 0， 重 用 bind 中 的 地 址 
SO_SNDBUF int 发 送 缓冲 区 的 字 节 长 度 

SO_SNDLOWAT int 发 送 调 用 中 传送 的 最 小 数据 字 节 数 
SO_SNDTIMEO struct timeval | 套 接 字 发 送 调用 的 超时 值 

SO_TYPE int 标识 套 接 字 类 型 (X getsockopt) 


图 16-21 ERFA 
参数 val 根据 选项 的 不 同 指向 一 个 数据 结构 或 者 一 个 整数 。 一 些 选项 是 on/off 开关 。 如 果 整 
数 非 0， 则 启用 选项 。 如 果 整 数 为 0， 则 禁止 选项 。 参 数 len 指定 了 val 指向 的 对 象 的 大 小 。 
可 以 使 用 getsockopt 函数 来 查看 选项 的 当前 值 。 


#include <sys/socket.h> 











int getsockopt (int sockfd, int level, int option, void *restrict val, 


socklen_t *restrict lenp); 





返回 值 ， 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 
参数 lenp 是 一 个 指向 整数 的 指针 。 在 调用 getsockopt 之 前 ， 设 置 该 整数 为 复制 选项 缓冲 
区 的 长 度 。 如 果 选 项 的 实际 长 度 大 于 此 值 ， 则 选项 会 被 截断 。 如 果实 际 长 度 正好 小 于 此 值 ， 那 么 
返回 时 将 此 值 更 新 为 实际 长 度 。 


和 实例 

当 服 务 器 终止 并 尝试 立即 重启 时 ， 图 16-12 中 的 函数 将 无 法 正常 工作 。 通 常情 况 下 ， 除 非 超 
时 (超时 时 间 一 般 是 几 分 钟 )， 否 则 TCR 的 实现 不 允许 绑 定 同一 个 地 址 。 幸 运 的 是 ， 套 接 字 选 项 
SO REUSEADDR 可 以 绕 过 这 个 限制 ， 如 图 16-22 所 示 。 








#include "apue.h" 
#include <errno.h> 
#include <sys/socket.h> 


int 
initserver(int type, const struct sockaddr *addr, socklen_t alen, 
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int qlen) 
{ 
int fd, err; 
int reuse = 1; 


if ((fd = socket(addr-»sa family, type, 0)) < 0) 
return(-1); 
if (setsockopt (fd, SOL SOCKET, SO REUSEADDR, &reuse, 
sizeof(int)) < 0) 
goto errout; 
if (bind(fd, addr, alen) < 0) 
goto errout; 
if (type == SOCK_STREAM || type == SOCK_SEQPACKET) 
if (listen(fd, qlen) < 0) 
goto errout; 
return (fd); 


errout: 
err = errno; 
close (fd); 
errno = err; 
return (-1); 


16-22 采用 地 址 复 用 初始 化 套 接 字 端点 供 服 务 器 使 用 
为 了 启用 so REUSEADDR 选项 , 设置 了 一 个 非 0 值 的 整数 ,并 把 这 个 整数 地 址 作为 val 参数 
传递 给 了 setsockopt. ¥ len 参数 设置 成 了 一 个 整数 大 小 来 表明 val 所 指 的 对 象 的 大 小 。 — m 


16.7 带 外 数据 


带 外 数据 (out-of-band data) 是 一 些 通信 协议 所 支持 的 可 选 功 能 ， 与 普通 数据 相 比 ， 它 允 
许 更 高 优先 级 的 数据 传输 。 带 外 数据 先行 传输 ， 即 使 传输 队列 已 经 有 数据 。TCP 支持 带 外 数 
据 , 但 是 UDP 不 支持 。 套 接 字 接 口 对 带 外 数据 的 支持 很 大 程度 上 受 TCP 带 外 数据 具体 实现 的 
影响 。 

TCP 将 带 外 数据 称 为 紧急 数据 Curgent data). TCP 仅 支持 一 个 字 节 的 紧急 数据 ， 但 是 允许 紧 
急 数据 在 普通 数据 传递 机 制 数据 流 之 外 传输 。 为 了 产生 紧急 数据 ， 可 以 在 3 个 send 函数 中 的 任 
何 一 个 里 指定 MSG_OOB 标志 。 如 果 带 MSG_OOB 标志 发 送 的 字 节 数 超过 一 个 时 ， 最 后 一 个 字 节 将 
被 视 为 紧急 数据 字 节 。 

如 果 通 过 套 接 字 安 排 了 信和 号 的 产生 ， 那 么 紧急 数据 被 接收 时 ， 会 发 送 SIGURG 信号。 在 3.14 
节 和 14.5.2 节 中 可 以 看 到 ， 在 fcnt1l 中 使 用 F sETOWN 命令 来 设置 一 个 套 接 字 的 所 有 权 。 如 果 
fcntl 中 的 第 三 个 参数 为 正 值 ， 那 么 它 指定 的 就 是 进程 DD。 如 果 为 非 -1 的 负 值 ， 那 么 它 代表 的 
就 是 进程 组 ID。 因 此 ， 可 以 通过 调用 以 下 函数 安排 进程 接收 套 接 字 的 信号: 

fentl(sockfd, F SETOWN, pid); 


F GETOWN 命令 可 以 用 来 获得 当前 套 接 字 所 有 权 。 对 于 了 _SETOWN 命令 , 负 值 代表 进程 组 ID， 
正 值 代表 进程 ID。 因 此 ， 调 用 


owner = fcntl(sockfd, F GETOWN, 0); 
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将 返回 owner, WR owner 为 正 值 ， 则 等 于 配置 为 接收 套 接 字 信号 的 进程 的 ID。 如 果 owner 为 
负 值 ， 其 绝对 值 为 接收 套 接 字 信号 的 进程 组 的 ID。 

TCP 支持 紧急 标记 (urgent mark) 的 概念 ， 即 在 普通 数据 流 中 紧急 数据 所 在 的 位 置 。 如 果 采 
用 套 接 字 选 项 so ooBINLINE, 那么 可 以 在 普通 数据 中 接收 紧急 数据 。 为 帮助 判断 是 否 已 经 到 达 
紧急 标记 ， 可 以 使 用 函数 sockatmark。 


#include <sys/socket.h> 





int sockatmark(int sockfd) ; 





返回 值 : 若 在 标记 处 ， 返 回 1; 若 没 在 标记 处 ， 返 回 0; 若 出 错 ， 返 回 -1 
当下 一 个 要 读 取 的 字 节 在 紧急 标志 处 时 ，sockatmark 返回 1。 
当 带 外 数据 出 现在 套 接 字 读 取 队 列 时 ，select 函数 CH 14.4.1 节 ) 会 返回 一 个 文件 描述 
符 并 且 有 一 个 待 处 理 的 异常 条 件 。 可 以 在 普通 数据 流 上 接收 紧急 数据 ， 也 可 以 在 其 中 一 个 
recv 函数 中 采用 MSG_OOB 标志 在 其 他 队列 数据 之 前 接收 紧急 数据 。TCP 队列 仅 用 一 个 字 节 的 
紧急 数据 。 如 果 在 接收 当前 的 紧急 数据 字 节 之 前 又 有 新 的 紧急 数据 到 来 ， 那 么 已 有 的 字 节 会 被 
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通常 ，recv 函数 没有 数据 可 用 时 会 阻塞 等 待 。 同 样 地 ， 当 套 接 字 输 出 队列 没有 足够 空间 来 
发 送 消息 时 ，send 函数 会 阻塞 。 在 套 接 字 非 阻塞 模式 下 ， 行 为 会 改变 。 在 这 种 情况 下 ， 这 些 函 
数 不 会 阻塞 而 是 会 失败 , 将 errno 设置 为 EWOULDBLOCK 或 者 EAGAIN。 当 这 种 情况 发 生 时 ,可 
以 使 用 poll 或 select 来 判断 能 否 接收 或 者 传输 数据 。 

Single UNIX Specification 包含 通用 异步 IO 机 制 ( 见 14.5 节 ) 的 支持 。 套 接 字 机 制 有 其 自己 
的 处 理 异 步 IO 的 方式 , 但 是 这 在 Single UNIX Specification 中 没有 标准 化 。 一 些 文献 把 经 典 的 基 
于 套 接 字 的 异步 VO 机 制 称 为 “基于 信和 号 的 IO”， 区 别 于 Single UNIX Specification 中 的 通用 异 
步 VO 机 制 。 

在 基于 套 接 字 的 异步 IO 中 ， 当 从 套 接 字 中 读 取 数据 时 ， 或 者 当 套 接 字 写 队 列 中 空间 变 得 可 
用 时 ， 可 以 安排 要 发 送 的 信号 SIGIO。 启 用 异步 IO 是 一 个 两 步骤 的 过 程 。 

COD 建立 套 接 字 所 有 权 ， 这 样 信 号 可 以 被 传递 到 合适 的 进程 。 

(2) 通知 套 接 字 当 VO 操作 不 会 阻塞 时 发 信号 。 

可 以 使 用 3 种 方式 来 完成 第 一 个 步骤 。 

(1) 在 fcntl HEH F. SETOWN 命令 。 

(2) f£ ioctl 中 使 用 FIOSETOWN 命令 。 

(3) 在 ioctl 中 使 用 SIOCSPGRP 命令 。 

要 完成 第 二 个 步骤 ， 有 两 个 选择 。 

(1) Æ fcntl 中 使 用 F_sETFL 命令 并 且 启 用 文件 标志 O_ASYNC. 

(2) fEioctl 中 使 用 FIOASYNC 命令 。 

虽然 有 多 种 选项 ， 但 它们 没有 得 到 普遍 支持 。 图 16-23 总 结 了 本 文 讨论 的 平台 支持 这 些 选项 
的 情况 。 
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| tcntl(fd, F SETOWN, pid) | F SETOWN, pid) 
ioctl(fd, FIOSETOWN, pid) 
ioctl(fd, SIOCSPGRP, pid) 












fcntl(fd, F SETFL, flags|O ASYNC) 
ioctl(fd, FIOASYNC, &n); 


图 16-23 BRERA VO 管理 命令 


16.9 小 结 


本 章 考 察 了 IPC 机 制 ， 这 些 机 制 允许 进程 与 不 同 计算 机 上 的 以 及 同一 计算 机 上 的 其 他 进程 通 
信 。 我 们 讨论 了 套 接 字 端 点 如 何 命名 ， 在 连接 服务 器 时 ， 如 何 发 现 所 用 的 地 址 。 

我 们 给 出 了 采用 无 连接 的 〈 即 基于 数据 报 的 ) 套 接 字 和 面向 连接 的 套 接 字 的 客户 端 和 服务 器 
的 实例 ， 还 简要 讨论 了 异步 和 非 阻 塞 的 套 接 字 1O， 以 及 用 于 管理 套 接 字 选项 的 接口 。 

下 一 章 将 会 考察 一 些 高 级 IPC 主题 ， 包 括 在 同一 台 计算 机 上 如 何 使 用 套 接 字 在 两 个 进程 之 间 
传送 文件 描述 符 。 


习题 


16.1 写 一 个 程序 判断 所 使 用 系统 的 字 节 序 。 

16.2 写 一 个 程序 ， 在 至 少 两 种 不 同 的 平台 上 打印 出 所 支持 套 接 字 的 stat 结构 成 员 ， 并 且 描 述 这 
些 结果 的 不 同 之 处 。 

16.3 图 16-17 的 程序 只 在 一 个 端点 上 提供 了 服务 。 修 改 这 个 程序 ， 同 时 支持 多 个 端点 《〈 每 个 端点 
具有 一 个 不 同 的 地 址 ) 上 的 服务 。 

16.4 写 一 个 客户 端 程序 和 服务 端 程序 ， 返 回 指定 主机 上 当前 运行 的 进程 数量 。 

16.5 在 图 16-18 的 程序 中 ， 服 务 器 等 待 子 进程 执行 uptime， 子 进程 完成 后 退出 ， 服 务 器 才 接受 
下 一 个 连接 请 求 。 重 新 设计 服务 器 ， 使 得 处 理 一 个 请 求 时 并 不 拖延 处 理 到 来 的 连接 请 求 。 
16.6 写 两 个 库 例 程 : 一 个 在 套 接 字 上 人 允许 异步 VO, 一 个 在 套 接 字 上 不 允许 异步 1O。 使 用 图 16-23 

来 保证 函数 能 够 在 所 有 平台 上 运行 ， 并 且 支持 尽 可 能 多 的 套 接 字 类 型 。 
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17.1 引言 


前 面 两 章 讨 论 了 UNIX 系统 提供 的 各 种 IPC， 其 中 包括 管道 和 套 接 字 。 本 章 介绍 一 种 高 级 
IPC 一 一 UNIX 域 套 接 字 机 制 , 并 说 明 它 的 应 用 方法 。 这 种 形式 的 IPC 可 以 在 同一 计算 机 系统 上 运 
行 的 两 个 进程 之 间 传 送 打 开 文 件 描述 符 。 服 务 进 程 可 以 使 它们 的 打开 文件 描述 符 与 指定 的 名 字 相 
关联 ， 同 一 系统 上 运行 的 客户 进程 可 以 使 用 这 些 名 字 与 服务 器 进程 汇聚 。 我 们 还 会 了 解 到 操作 系 
统 如 何 为 每 一 个 客户 进程 提供 一 个 独 用 的 IPC 通道 。 


17.2 UNIX 域 套 接 字 


UNIX 域 套 接 字 用 于 在 同一 台 计 算 机 上 运行 的 进程 之 间 的 通信 。 虽 然 因 特 网 域 套 接 字 可 用 于 
同一 目的 ， 但 UNIX 域 套 接 字 的 效率 更 高 。UNIX 域 套 接 字 仅仅 复制 数据 ， 它 们 并 不 执行 协议 处 
理 ， 不 需要 添加 或 删除 网 络 报头 ， 无 需 计 算 校 验 和 ， 不 要 产生 顺序 号 ， 无 需 发 送 确 认 报 文 。 
UNIX 域 套 接 字 提 供 流 和 数据 报 两 种 接口 。UNIX 域 数据 报 服务 是 可 靠 的 ， 既 不 会 丢失 报 文 
也 不 会 传递 出 错 。UNIX 域 套 接 字 就 像 是 套 接 字 和 管道 的 混合 。 可 以 使 用 它们 面向 网 络 的 域 套 接 
字 接 口 或 者 使 用 socketpair 函数 来 创建 一 对 无 命名 的 、 相 互 连 接 的 UNIX 域 套 接 字 。 





#include <sys/socket.h> 


int socketpair(int domain, int type, int protocol, int sockfd[2]); 


返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 


虽然 接口 足够 通用 ， 人 允许 socketpair 用 于 其 他 域 ， 但 一 般 来 说 操 用 户 进程 
作 系 统 仅 对 UNIX 域 提 供 支持 。 

一 对 相互 连接 的 UNIX 域 套 接 字 可 以 起 到 全 双 工 管道 的 作用 : 两 端 对 
读 和 写 开放 ( 见 图 17-1)。 我 们 将 其 称 为 fd 管道 (fd-pipe )， 以 便 与 普通 
的 半 双 工 管道 区 分 开 来 。 











fd[0] fd[1] 








a Xfi: £d pipe AK 
图 17-2 展示 了 £d pipe 函数 ， 它 使 用 socketpair 函数 来 创建 一 
对 相互 连接 的 UNIX 域 流 套 接 字 。 


#include "apue.h" 
#include <sys/socket.h> 





图 17-1 套 接 字 对 
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/* 
* Returns a full-duplex pipe (a UNIX domain socket) with 
* the two file descriptors returned in fd[0] and fd[1]. 
*/ 
int 
fd_pipe(int fd[2]) 
{ 
return(socketpair(AF UNIX, SOCK STREAM, 0, fd)); 


) 
17-2 ”创建 一 个 全 双 工 管道 


某 些 基于 BSD 的 系统 使 用 UNIX 域 套 接 字 来 实现 管道 。 但 当 调用 pipe 时 , 第 一 描述 符 的 写 
630 端 和 第 二 描述 符 的 读 端 都 是 关闭 的 。 为 了 得 到 全 双 工 管道 ， 必 须 直 接 调 用 socketpair. E 


加 实例 : 借助 UNIX 域 套 接 字 轮 询 XSI 消息 队列 


15.6.4 节 曾 经 提 到 XSI 消息 队列 的 使 用 存在 一 个 问题 ， 即 不 能 将 它们 和 poll 或 者 select 
一 起 使 用 ， 这 是 因为 它们 不 能 关联 到 文件 描述 符 。 然 而 ， 套 接 字 是 和 文件 描述 符 相 关联 的 ， 消 息 
到 达 时 ， 可 以 用 套 接 字 来 通知 。 对 每 个 消息 队列 使 用 一 个 线程 。 每 个 线程 都 会 在 msgrcv 调用 中 
阻塞 。 当 消息 到 达 时 ， 线 程 会 把 它 写 入 一 个 UNIX 域 套 接 字 的 一 端 。 当 poll 指示 套 接 字 可 以 读 
取 数 据 时 ， 应 用 程序 会 使 用 这 个 套 接 字 的 另外 一 端 来 接收 这 个 消息 。 

图 17-3 中 的 程序 说 明了 这 个 技术 。main 函数 中 创建 了 一 些 消 息 队 列 和 UNIX 域 套 接 字 ， 并 
为 每 个 消息 队列 开启 了 一 个 新 线程 。 然 后 它 在 一 个 无 限 循环 中 用 poll 来 轮 询 选择 一 个 套 接 字 端 
点 。 当 某 个 套 接 字 可 读 时 ， 程 序 可 以 从 套 接 字 中 读 取 数据 并 把 消息 打印 到 标准 输出 上 。 
#include "apue.h" 
#include <poll.h> 
#include <pthread.h> 


#include <sys/msg.h> 
#include <sys/socket.h> 


#define NQ 3 /* number of queues */ 
#define MAXMSZ 512 /* maximum message size */ 
#define KEY 0x123 /* key for first message queue */ 


struct threadinfo ( 
int qid; 
int fd; 

) 


struct mymesg { 

long mtype; 

char mtext [MAXMSZ]; 
H 


void * 

helper(void *arg) 

{ 
int n; 
struct mymesg m; 
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struct threadinfo *tip = arg; 


for(;;) { 
memset (& 
if ((n = 


if (writ 


m, 0, sizeof(m)); 





msgrcv(tip-»qid, &m, MAXMSZ, 0, MSG NOERROR)) < 0) 
err sys("msgrcv error"); 


e(tip->fd, m.mtext, n) < 0) 


err sys("write error"); 


int Ll, D, etr 
int fd[2]; 

int qid[NQ]; 
struct pollfd pfd[NQ]; 
struct threadinfo ti[NQ]; 
pthread t tid[NQ]; 
char buf [MAXMSZ] ; 


for (i = OF * «NO Ttk) f 


if ((qid 


[i] = msgget ((KEY+i), IPC CREAT|0666)) < 0) 


err sys("msgget error"); 


printf ("queue ID $d is %d\n", i, qid[i]); 
if (socketpair(AF UNIX, SOCK DGRAM, 0, fd) < 0) 
err sys("socketpair error"); 
pfd[i].fd = fd[0]; 
pfd[i].events = POLLIN; 
ti[il.qid = qid[i]l; 
ti[i].fd = fai]; 
if ((err = pthread create(&tid[i], NULL, helper, &ti[i])) 


err exit(err, "pthread create error"); 


for (;;) { 
if (poll 
err. 
for (i = 
if ( 
) 
} 
} 
exit (0); 


(pfd, NQ, -1) < 0) 
sys("poll error"); 
0; i < NQ: i**) { 
pfd[i].revents & POLLIN) { 
if ((n = read(pfd[i].fd, buf, sizeof(buf))) « 0) 
err sys("read error"); 
buf[n] = 0; 
printf("queue id $d, message %s\n", qid[i], buf); 


图 17-3 ”使 用 UNIX 域 套 接 字 轮 询 XSI 消息 队列 


!= 0) 
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注意 ， 我 们 使 用 的 是 数据 报 (SOCK_DGRAM) 套 接 字 而 不 是 流 套 接 字 。 这 样 做 可 以 保持 消息 
边界 ， 以 保证 从 套 接 字 里 一 次 只 读 取 一 条 消息 。 
这 种 技术 可 以 〈 非 直接 地 ) 在 消息 队列 中 运用 poll 或 者 select。 只 要 为 每 个 队列 分 配 一 
个 线程 的 开销 以 及 每 个 消息 额外 复制 两 次 〈 一 次 写 入 套 接 字 ， 另 一 次 从 套 接 字 里 读 取出 来 ) 的 开 
销 是 可 接受 的 ， 这 种 技术 就 会 使 XSI 消息 队列 的 使 用 更 加 容易 。 
632 使 用 图 17-4 中 所 示 的 程序 给 图 17-3 中 所 示 的 测试 程序 发 送 消息 。 


#include "apue.h" 
#include <sys/msg.h> 


#define MAXMSZ 512 


struct mymesg { 

long mtype; 

char mtext [MAXMSZ]; 
}; 


int 
main(int argc, char *argv[]) 
{ 

key_t key; 

long qid; 

size_t nbytes; 

struct mymesg m; 


if (arge != 3) { 
fprintf(stderr, "usage: sendmsg KEY message\n"); 
exit (1); 
} 
key = strtol(argv[1], NULL, 0); 
if ((qid = msgget(key, 0)) < 0) 
err sys("can't open queue key %s", argv[1]); 
memset(&m, 0, sizeof(m)); 
strncpy(m.mtext, argv[2], MAXMSZ-1); 
nbytes - strlen(m.mtext); 
m.mtype - 1; 
if (msgsnd(qid, &m, nbytes, 0) < 0) 
err sys("can't send message"); 
exit(0); 


图 17-4 给 XSI 消息 队列 发 送 消息 
这 个 程序 需要 两 个 参数 : 消息 队列 关联 的 键 值 以 及 一 个 包含 消息 主体 的 字符 串 。 发 送 消息 到 
服务 器 端 时 ， 它 会 打印 如 下 信息 : 


5 ./pollmsg & 在 后 台 运 行 服务 器 

[1] 12814 

$ queue ID 0 is 196608 

queue ID 1 is 196609 

queue ID 2 is 196610 

$ ./sendmsg 0x123 "hello, world" 给 第 一 个 队列 发 送 一 条 消息 
queue id 196608, message hello, world 

$ ./sendmsg 0x124 "just a test" 给 第 二 个 队列 发 送 一 条 消息 
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queue id 196609, message just a test 
$ ./sendmsg 0x125 "bye" 给 第 三 个 队列 发 送 一 条 消息 
queue id 196610, message bye u 


命名 UNIX 域 套 接 字 


虽然 socketpair 函数 能 创建 一 对 相互 连接 的 套 接 字 ， 但 是 每 一 个 套 接 字 都 没有 名 字 。 这 
意味 着 无 关 进 程 不 能 使 用 它们 。 

在 16.3.4 节 中 学 习 了 如 何 将 一 个 地 址 绑 定 到 一 个 因特网 域 套 接 字 上 。 恰 如 因特网 域 套 接 字 一 
样 ， 可 以 命名 UNIX 域 套 接 字 ， 并 可 将 其 用 于 告示 服务 。 但 是 要 注意 ，UNIX 域 套 接 字 使 用 的 地 
址 格式 不 同 于 因特网 域 套 接 字 。 

回忆 16.3 节 ， 套 接 字 地 址 格式 会 随 实现 而 变 。UNIX 域 套 接 字 的 地 址 由 sockaddr_un 结构 
表示 。 在 Linux 3.2.0 和 Solaris 10 中 ，sockaddr_un 结构 在 头 文件 <sys/un.h> 中 的 定义 
如 下 : 


struct sockaddr un { 
sa family t sun family; /* AF_UNIX */ 
char sun_path[108]; /* pathname */ 
}; 


但 是 在 FreeBSD 8.0 fll Mac OS X 10.6.8 中 ，sockaddr_un 结构 的 定义 如 下 : 


struct sockaddr un { 


unsigned char sun len; /* sockaddr length */ 
sa family t sun family; /* AF UNIX */ 
char sun path[104]; /* pathname */ 


); 

sockaddr un 结构 的 sun path 成 员 包含 一 个 路 径 名 。 当 我 们 将 一 个 地 址 绑 定 到 一 个 UNIX 
域 套 接 字 时 ， 系 统 会 用 该 路 径 名 创建 一 个 S_IFSOCK 类 型 的 文件 。 

该 文件 仅 用 于 向 客户 进程 告示 套 接 字 名 字 。 该 文件 无 法 打开 ， 也 不 能 由 应 用 程序 用 于 
通信 。 

如 果 我 们 试图 绑 定 同一 地 址 时 ,该 文件 已 经 存在 ， 那么 bind 请 求 会 失败 。 当 关闭 套 接 字 时 ， 
并 不 自动 删除 该 文件 ， 所 以 必须 确保 在 应 用 程序 退出 前 ， 对 该 文件 执行 解除 链接 操作 。 


g kl 
图 17-5 所 示 的 程序 是 一 个 将 地 址 绑 定 到 UNIX 域 套 接 字 的 例子 。 


运行 此 程序 时 ，binq 请 求 成 功 执行 。 但 是 ， 若 第 二 次 运行 该 程序 ， 则 出 错 返回 ， 其 原因 是 
该 文件 已 经 存在 。 在 删除 该 文件 之 前 ， 该 程序 不 会 再 成 功 运行 。 


$ ./a.out 运行 该 程序 

UNIX domain socket bound 

$ 1s -1 foo.socket 查看 套 接 字 文件 
srwxrw-xr-x 1 sar 0 May 18 00:44 foo.socket 

$ ./a.out 试图 再 次 运行 该 程序 
bind failed: Address already in use 

$ rm foo.socket 删除 该 套 接 字 文件 
$ ./a.out 第 三 次 运行 该 程序 


UNIX domain socket bound 现在 成 功 啦 
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#include "apue.h" 
#include <sys/socket.h> 
#include <sys/un.h> 


int 
main (void) 
{ 
int fd, size; 
struct sockaddr_un un; 


un.sun_family = AF_UNIX; 
strcpy(un.sun path, "foo.socket"); 
if ((fd = socket(AF UNIX, SOCK STREAM, 0)) < 0) 
err sys("socket failed"); 
size = offsetof(struct sockaddr un, sun path) + strlen(un.sun path); 
if (bind(fd, (struct sockaddr *)&un, size) < 0) 
err sys("bind failed"); 
printf ("UNIX domain socket bound Mn"); 
exit (0); 


图 17-5 ”将 地 址 绑 定 到 UNIX SE BET. 
确定 绑 定 地 址 长 度 的 方法 是 ， 先 计算 sun path 成 员 在 sockaddr un 结构 中 的 偏 移 量 ， 然 
后 将 结果 与 路 径 名 长 度 ( 不 包括 终止 null 字符 ) 相 加 。 因 为 sockaddr un 结构 中 sun path 之 
前 的 成 员 与 实现 相关 ， 所 以 我 们 使 用 <stddef.h> 头 文件 (包括 在 apue.h 中 ) 中 的 offsetof 
宏 计 算 sun_path 成 员 从 结构 开始 处 的 偏 移 量 。 如 果 查 看 <stddef .h>， 则 可 见 到 类 似 于 下 列 形 
式 的 定义 : 


#define offsetof (TYPE, MEMBER) ((int)&((TYPE *)0) -»MEMBER) 


假定 该 结构 从 地 址 0 开始 ， 此 表达 式 求 得 成 员 起 始 地 址 的 整 型 值 。 = 
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服务 器 进程 可 以 使 用 标准 bind、1listen 和 accept MAM, 为 客户 进程 安排 一 个 唯一 UNIX 
域 连接 。 客 户 进程 使 用 connect 与 服务 器 进程 联系 。 在 服务 器 进程 接受 了 connect 请 求 后 , 在 
服务 器 进程 和 客户 进程 之 间 就 存在 了 唯一 连接 。 这 种 风格 的 操作 与 我 们 在 图 16-16 和 图 16-17 中 
所 示 的 对 因特网 域 套 接 字 的 操作 相同 。 

图 17-6 展示 了 客户 进程 和 服务 器 进程 存在 连接 之 前 二 者 的 情形 。 服务 器 端 把 它 的 套 接 字 绑 定 
到 sockaddr un 的 地 址 并 监听 新 的 连接 请 求 。 图 17-7 展示 了 在 服务 器 端 接受 客户 端 连接 请 求 后 ， 
客户 端 和 服务 器 端 之 间 建 立 的 唯一 的 连接 。 

现在 ， 我 们 将 开发 3 个 函数 ， 使 用 这 些 函数 可 以 在 运行 于 同一 台 计 算 机 上 的 两 个 无 关 进程 之 
间 创 建 唯 一 连接 。 这 些 函 数 模仿 了 在 16.4 节 中 讨论 过 的 面向 连接 的 套 接 字 函数 。 这 里 ， 我 们 将 
UNIX 域 套 接 字 应 用 于 底层 通信 机 制 。 


17.3 ”唯一 连接 513 


服务 器 进程 客户 进程 





I. 
图 17-6 connect 之 前 的 客户 端 图 17-7 connect 之 后 的 客户 端 
套 接 字 和 服务 器 端 套 接 字 套 接 字 和 服务 器 端 套 接 字 


#include "apue.h" 
int serv listen(const char *name); 
返回 值 : 若 成 功 ， 返 回 要 监听 的 文件 描述 符 ; 若 出 错 ， 返 回 负 值 


int serv_accept (int listenfd, uid t *uidptr) ; 


返回 值 : 车 成 功 ， 返 回 新 文件 描述 符 ， 若 出 错 ， 返 回 负 值 


int cli conn(const char *name) ; 





RMA: 若 成 功 ， 返 回 文 件 描述 符 ， 若 出 错 ， 返 回 负 什 


服务 器 进程 可 以 调用 serv listen 函数 ( 见 图 17-8) 声明 它 要 在 一 个 众所周知 的 名 字 文 件 
系统 中 的 某 个 路 径 名 ) 上 监听 客户 进程 的 连接 请 求 。 当 客户 进程 想 要 连接 至 服务 器 进程 时 ， 它 们 将 
使 用 该 名 字 。serv_1isten 函数 的 返回 值 是 用 于 接收 客户 进程 连接 请 求 的 服务 器 UNIX 域 套 接 字 。 

服务 器 进程 可 以 使 用 serv accept 函数 〈 见 图 17-9) 等 待 客户 进程 连接 请 求 的 到 达 。 当 一 
个 请 求 到 达 时 ， 系 统 自 动 创建 一 个 新 的 UNIX 域 套 接 字 ， 并 将 它 与 客户 端 套 接 字 连接 ， 最 后 将 这 
个 新 套 接 字 返回 给 服务 器 。 此 外 ， 客 户 进程 的 有 效用 户 ID 存放 在 widptr 指向 的 存储 区 中 。 

客户 进程 调用 cli_conn 函数 ( 见 图 17-100 连接 至 服务 器 进程 。 客 户 进程 指定 的 name 参数 
必须 与 服务 器 进程 调用 serv listen 函数 时 所 用 的 名 字 相 同 。 函 数 返回 时 ， 客 户 进程 得 到 接连 
至 服务 器 进程 的 文件 描述 符 。 

图 17-8 给 出 了 serv. listen 函数 。 

#include "apue.h" 
#include <sys/socket.h> 


#include <sys/un.h> 
#include <errno.h> 


#define QLEN 10 


/[* 
* Create a server endpoint of a connection. 
* Returns fd if all OK, «0 on error. 
my 
int 
serv_listen(const char *name) 
{ 
int fd, len, err, rval; 
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struct sockaddr un un; 


if (strlen(name) >= sizeof(un.sun_path)) { 
errno = ENAMETOOLONG; 
return (-1); 


/* create a UNIX domain stream socket */ 
if ((fd = socket(AF UNIX, SOCK STREAM, 0)) < 0) 
return(-2); 


unlink (name); /* in case it already exists */ 


/* fill in socket address structure */ 

memset(&un, 0, sizeof(un)); 

un.sun family - AF UNIX; 

strcpy(un.sun path, name); 

len = offsetof(struct sockaddr un, sun path) + strlen(name); 


/* bind the name to the descriptor */ 
637 if (bind(fd, (struct sockaddr *)&un, len) < 0) { 
rval = -3; 
goto errout; 


if (listen(fd, QLEN) < 0) { /* tell kernel we're a server */ 
rval = -4; 
goto errout; 

) 

return(fd); 


errout: 
err = errno; 
close (fd); 


errno = err; 
return (rval); 


17-8 serv listen 函数 


首先 ， 调 用 socket 创建 一 个 UNIX 域 套 接 字 。 然 后 将 欲 赋 给 套 接 字 的 众所周知 的 路 径 名 填 
入 sockaddr un 结构 。 该 结构 是 调用 pina 的 参数 。 ER, 不 需要 设置 某 些 平台 提供 的 sun_len 
字段 ， 因 为 操作 系统 会 用 传送 给 bind 函数 的 地 址 长 度 设置 该 字段 。 

最 后 ,调用 listen A% CW 16.4 节 ) 来 通知 内 核 该 进程 将 作为 服务 器 进程 等 待 客户 进程 的 
连接 请 求 。 当 收 到 一 个 客户 进程 的 连接 请 求 后 , 服务 器 进程 调用 serv accept 函数 ( 见 图 17-9). 
#include "apue.h" 

#include <sys/socket.h> 
#include <sys/un.h> 


#include <time.h> 
#include <errno.h> 


#define STALE 30 /* client's name can't be older than this (sec) */ 


/* 





* Wait for a client connection to arrive, 
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and accept it. 


* We also obtain the client's user ID from the pathname 


* 

* 

Ey 
int 


that it must bind before calling us. 
Returns new fd if all OK, <0 on error 


serv_accept (int listenfd, uid_t *uidptr) 


{ 


int clifd, err, rval; 
socklen_t len; 

time_t staletime; 

struct sockaddr_un un; 

struct stat statbuf; 

char *name; 


/* allocate enough space for longest name plus 


terminating null */ 


if ((name = malloc(sizeof(un.sun path) + 1)) == NULL) 


return(-1); 

len = sizeof (un); 

if ((clifd - accept(listenfd, (struct sockaddr 
free (name); 
return(-2); /* often errno-EINTR, if 


*)&un, &len)) < 0) { 


signal caught */ 


/* obtain the client's uid from its calling address */ 


len -= offsetof(struct sockaddr un, sun path); 
memcpy(name, un.sun path, len); 
name[len] = 0; /* null terminate */ 
if (stat(name, &statbuf) < 0) { 

rval = -3; 


goto errout; 


#ifdef | S ISSOCK /* not defined for SVR4 */ 
if (S ISSOCK(statbuf.st mode) == 0) { 
rval = -4; /* not a socket */ 
goto errout; 
} 
#endif 
if ((statbuf.st mode & (S IRWXG | S IRWXO)) || 
(statbuf.st mode & S IRWXU) != S IRWXU) { 


rval = -5; /* is not rwx------ */ 
goto errout; 


staletime = time(NULL) - STALE; 
if (statbuf.st_atime < staletime || 
statbuf.st_ctime < staletime || 
statbuf.st_mtime < staletime) { 
rval = -6; /* i-node is too old */ 
goto errout; 


if (uidptr != NULL) 


/* len of pathname */ 
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*uidptr = statbuf.st uid; /* return uid of caller */ 
unlink (name) ; /* we're done with pathname now */ 
free (name); 
return(clifd); 


errout: 
err = errno; 
close(clifd); 
free (name); 
errno - err; 
return(rval); 


图 17-9 serv accept 函数 


服务 器 进程 在 调用 serv accept 中 阻塞 ， 等 待 一 个 客户 进程 调用 cli conn. A accept 
返回 时 , 返回 值 是 连接 到 客户 进程 的 轩 新 的 描述 符 。 另 外 ，accept 函数 也 经 由 其 第 二 个 参数 OR 
向 sockaddr_un 结构 的 指针 ) 返回 客户 进程 赋 给 其 套 接 字 的 路 径 名 (包含 客户 进程 ID 的 名 字 )。 
接着 ,程序 复制 这 个 路 径 名 ， 并 确保 它 是 以 null 终止 的 (如果 路 径 名 占用 了 sockaddr un 结构 
里 的 sun path 成 员 所 有 的 可 用 空间 ， 那 就 没有 空间 存放 终止 null 字符 )。 然 后 ， 调 用 stat K 
数 验证 : 该 路 径 名 确实 是 一 个 套 接 字 ;其 权限 仅 允 许 用 户 读 、 用 户 写 以 及 用 户 执行 。 还 要 验证 与 
套 接 字 相 关联 的 3 个 时 间 参 数 不 比 当前 时 间 早 30 秒 。( 回 忆 6.10 节 ，time 函数 返回 当前 时 间 和 
日 期 ， 用 公元 1970 年 1 月 1 日 00:00:00 以 来 经 过 的 秒 数 表示 。) 

如 若 通过 了 所 有 这 些 检验 , 则 可 认为 客户 进程 的 身份 (其 有 效用 户 ID) 是 该 套 接 字 的 所 有 者 。 
虽然 这 种 检验 并 不 完善 ， 但 这 是 对 当前 系统 所 能 做 到 的 最 佳 方案 。( 如 若 内 核能 通过 accept 的 
参数 返回 有 效用 户 ID， 则 会 更 好 一 些 。) 

客户 进程 调用 cli conn 函数 〈 见 图 17-10) 对 连 到 服务 器 进程 的 连接 进行 初始 化 。 
#include "apue.h" 

#include <sys/socket.h> 


#include <sys/un.h> 
#include <errno.h> 





#define CLI_PATH "/var/tmp/" 
#define CLI_PERM S_IRWXU /* rwx for user only */ 
/* 


* Create a client endpoint and connect to a server. 
* Returns fd if all OK, «0 on error. 

£y 

int 

cli_conn(const char *name) 


{ 


int fd, len, err, rval; 
struct sockaddr_un un, sun; 

int do_unlink = 0; 

if (strlen(name) >= sizeof(un.sun_path)) { 


errno = ENAMETOOLONG; 
return (-1); 
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/* create a UNIX domain stream socket */ 
if ((fd = socket(AF UNIX, SOCK STREAM, 0)) < 0) 
return(-1); 


/* fill socket address structure with our address */ 

memset(&un, 0, sizeof(un)); 

un.sun family - AF UNIX; 

sprintf(un.sun path, "%s%05ld", CLI PATH, (long) getpid()); 

len = offsetof(struct sockaddr un, sun path) + strlen(un.sun path); 


unlink(un.sun path); /* in case it already exists */ 
if (bind(fd, (struct sockaddr *)&un, len) < 0) ( 
rval = -2; 


goto errout; 
) 
if (chmod(un.sun path, CLI PERM) « 0) ( 
rval = -3; 
do unlink = 1; 
goto errout; 


) 


/* fill socket address structure with server's address */ 
memset(&sun, 0, sizeof(sun)); 
sun.sun family - AF UNIX; 
strcpy(sun.sun path, name); 
len = offsetof(struct sockaddr un, sun path) + strlen(name); 
if (connect(fd, (struct sockaddr *)&sun, len) < 0) { 
rval = -4; 
do unlink = 1; 
goto errout; 
} 
return (fd); 


errout: 
err = errno; 
close (fd); 
if (do_unlink) 
unlink(un.sun path); 
errno = err; 
return (rval); 





图 17-10 cli conn 函数 

调用 socket 函数 创建 UNIX 域 套 接 字 的 客户 进程 端 ， 然 后 用 客户 进程 专 有 的 名 字 填 入 
sockaddr_un 结构 。 

此 例 中 没 让 系统 选择 默认 地 址 ， 其 原因 是 ， 如 果 这 样 处 理 ， 服 务 器 进程 将 不 能 区 分 各 个 客户 
进程 (如 果 不 为 UNIX 域 套 接 字 显 式 地 绑 定 名 字 ， 内 核 会 代表 我 们 隐 式 地 绑 定 一 个 地 址 且 不 会 在 
文件 系统 创建 文件 来 表示 这 个 套 接 字 )。 于 是 ， 我 们 绑 定 自己 的 地 址 ， 但 在 开发 使 用 套 接 字 的 客 
户 端 程序 时 通常 并 不 采用 这 一 步骤 。 

绑 定 的 路 径 名 的 最 后 5 个 字符 来 自 客户 进程 ID。 仅 在 该 路 径 名 已 存在 时 调用 unlink。 然 后 ， 
调用 bind 将 名 字 赋 给 客户 进程 套 接 字 。 这 在 文件 系统 中 创建 了 一 个 套 接 字 文件 ， 所 用 的 名 字 与 
被 绑 定 的 路 径 名 一 样 。 接 着 ， 调 用 chmod 关闭 除 用 户 读 、 用 户 写 以 及 用 户 执 行 以 外 的 其 他 权限 。 
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在 serv accept 中 ， 服 务 器 进程 检验 这 些 权 限 以 及 套 接 字 用 户 ID 以 验证 客户 进程 的 身份 。 
641 然后 ， 必 须 填 充 另 一 个 sockaddr_un 结构 ， 这 次 用 的 是 服务 进程 众所周知 的 路 径 名 。 最 后 ， 
调用 connect 函数 初始 化 与 服务 进程 的 连接 。 


17.4 ”传送 文件 描述 符 


在 两 个 进程 之 间 传 送 打开 文件 描述 符 的 技术 是 非常 有 用 的 。 因 此 可 以 对 客户 进程 -服务 器 进程 
应 用 进行 不 同 的 设计 。 它 使 一 个 进程 (通常 是 服务 器 进程 ) 能 够 处 理 打 开 一 个 文件 所 要 做 的 一 切 
操作 《〈 包 括 将 网 络 名 翻译 为 网 络 地 址 、 拨 号 调制 解 调 器 、 协 商 文件 锁 等 ) 以 及 向 调用 进程 送 回 一 
个 描述 符 ， 该 描述 符 可 被 用 于 以 后 的 所 有 VO 函数 。 涉 及 打开 文件 或 设备 的 所 有 细节 对 客户 进程 
而 言 都 是 透明 的 。 

下 面 进一步 说 明 从 一 个 进程 向 另 一 个 进程 “传送 一 个 打开 文件 描述 符 ” 的 含义 。 回 忆 图 3-8, 
其 中 显示 了 两 个 进程 ， 它 们 打开 了 同一 文件 。 虽 然 它们 共享 同一 个 v 节点 ， 但 每 个 进程 都 有 它 自 
己 的 文件 表 项 。 

当 一 个 进程 向 另 一 个 进程 传送 一 个 打开 文件 描述 符 时 ， 我 们 想 让 发 送 进程 和 接收 进程 共享 同 
一 文件 表 项 。 图 17-11 显示 了 所 期 望 的 安排 。 
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图 17-11 ”从 顶部 进程 传送 一 个 打开 文件 至 底部 进程 
在 技术 上 ， 我 们 是 将 指向 一 个 打开 文件 表 项 的 指针 从 一 个 进程 发 送 到 另外 一 个 进程 。 该 指针 
被 分 配 存放 在 接收 进程 的 第 一 个 可 用 描述 符 项 中 。( 注 意 ， 不 要 造成 错觉 ， 以 为 发 送 进程 和 接收 
进程 中 的 描述 符 编 号 是 相同 的 ， 它 们 通常 是 不 同 的 。) 两 个 进程 共享 同一 个 打开 文件 表 ， 这 与 fork 
之 后 的 父 进程 和 子 进程 共享 打开 文件 表 的 情况 完全 相同 〈 见 图 8-25. 
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当 发 送 进程 将 描述 符 传送 给 接收 进程 后 ， 通 常会 关闭 该 描述 符 。 发 送 进程 关闭 该 描述 符 并 不 会 真 的 
关闭 该 文件 或 设备 ， 其 原因 是 该 描述 符 仍 被 视 为 由 接收 进程 打开 即使 接收 进程 尚未 接收 到 该 描述 符 )。 
下 面 定义 本 章 用 以 发 送 和 接收 文件 描述 符 的 3 个 函数 。 本 节 后 面 会 给 出 这 3 个 函数 的 代码 。 


#include "apue.h" 





int send_fd(int fd, int fd to send); 
int send err(int fd, int status, const char *errmsg) ; 

两 个 函数 的 返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 
int recv_fd(int fd, ssize_t (*userfunc) (int, const void *, size_t)); 


返回 值 : 若 成 功 ， 返 回 文件 描述 符 ， 若 出 错 ， 返 回 负 值 


当 一 个 进程 (通常 是 服务 器 进程 ) 想 将 一 个 描述 符 传 送 给 另 一 个 进程 时 ， 可 以 调用 send £d 
或 send_err。 等 待 接 收 描述 符 的 进程 (客户 进程 ) 调用 recv fd. 

send fd 使 用 fd 代表 的 UNIX 域 套 接 字 发 送 描述 符 fd to send. send err 使 用 fd RIX 
errmsg 以 及 后 随 的 status 字 节 。status 的 值 应 在 -1 一 -255。 

客户 进程 调用 recv_fd 接收 描述 符 。 如 果 一 切 正常 (发 送 者 调用 了 send_fd)， 则 函数 返回 
值 为 非 负 描述 符 。 否 则 ， 返 回 值 是 由 send err 发 送 的 status (-1~-255 的 一 个 负 值 )。 另 外 ， 如 
果 服 务 器 进程 发 送 了 一 条 出 错 消息 ， 则 客户 进程 调用 它 自 己 的 userfunc 函数 处 理 该 消息 。userfunc 
的 第 一 个 参数 是 常量 STDERR_FILENO， 然 后 是 指向 出 错 消 息 的 指针 及 其 长 度 。userfunc 函数 的 
返回 值 是 已 写 的 字 节 数 或 负 的 出 错 编号 值 。 客 户 进程 常 将 普通 的 write 函数 指定 为 userfiunc。 

我 们 实现 用 于 这 3 个 函数 的 我 们 自己 制定 的 协议 。 为 发 送 一 个 描述 符 ，send_fd 先 发 送 2 字 
35 0， 然 后 是 实际 描述 符 。 为 了 发 送 一 条 出 错 消息 ，send_err 发 送 errmsg， 然 后 是 1 字 节 0， 
最 后 是 status 字 节 的 绝对 值 (1 一 255)。recv_fd 函数 读 取 套 接 字 中 所 有 字 节 直至 遇 到 null 字符 。 
null 字符 之 前 的 所 有 字符 都 传送 给 调用 者 的 userfurnc。recv_fq 读 取 的 下 一 个 字 节 是 状态 (status) 
字 节 。 若 状态 字 节 为 0， 则 表示 一 个 描述 符 已 传送 过 来 ， 和 否则 表示 没有 描述 符 可 接收 。 

send err 函数 在 将 出 错 消 息 写 到 套 接 字 后 ， 即 调用 sena ta 函数 ， 如 图 17-12 所 示 。 


#include "apue.h" 








/* 

* Used when we had planned to send an fd using send_fd(), 

* but encountered an error instead. We send the error back 
* using the send_fd()/recv_fd() protocol. 

*/ 

int 

send err(int fd, int errcode, const char *msg) 

{ 


int n; 
if ((n = strlen(msg)) > 0) 
if (writen(fd, msg, n) != n) /* send the error message */ 


return (-1); 


if (errcode >= 0) 
errcode = -1; /* must be negative */ 


if (send_fd(fd, errcode) < 0) 
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return(-1); 


return (0); 


17-12. send err 函数 
为 了 用 UNIX 域 套 接 字 交换 文件 描述 符 ， 调 用 sendmsg(2) 和 recvmsg(2) 函 数 ( 见 16.5 节 )。 
这 两 个 函数 的 参数 中 都 有 一 个 指向 msghdr 结构 的 指针 ， 该 结构 包含 了 所 有 关于 要 发 送 或 要 接收 
的 消息 的 信息 。 该 结构 的 定义 大 致 如 下 : 


struct msghdr { 


void *msg_name; /* optional address */ 

socklen_t msg_namelen; /* address size in bytes */ 
struct iovec *msg_iov; /* array of I/O buffers */ 

int msg_iovlen; /* number of elements in array */ 
void *msg_control; /* ancillary data */ 

socklen_t msg_controllen; /* number of ancillary bytes */ 
int msg_flags; /* flags for received message */ 


E 

前 两 个 元 素 通常 用 于 在 网 络 连接 上 发 送 数据 报 ， 其 中 目的 地 址 可 以 由 每 个 数据 报 指定 。 接 下 
来 的 两 个 元 素 使 我 们 可 以 指定 一 个 由 多 个 缓冲 区 构成 的 数组 〈 散 布 读 和 聚集 写 )， 这 与 对 readv 
和 writev 函数 ( 见 14.6 节 ) 的 说 明 一 样 。 msg_flags 字段 包含 了 描述 接收 到 的 消息 的 标志 ， 
图 16-15 总 结 了 这 些 标志 。 

两 个 元 素 处 理 控制 信息 的 传送 和 接收 。msg_control 字段 指向 omsghdr (控制 信息 头 ) 结 
构 ，msg_controllen 字段 包含 控制 信息 的 字 节 数 。 


struct cmsghdr { 


Socklen t cmsg_len; /* data byte count, including header */ 
int cmsg level; /* originating protocol */ 
int cmsg type; /* protocol-specific type */ 


/* followed by the actual control message data */ 
i 


为 了 发 送 文件 描述 符 ， 将 cmsg_len 设置 为 cmsghdr 结构 的 长 度 加 一 个 整 型 的 长 度 〈 描 述 
符 的 长 度 )，cmg_level 字段 设置 为 SOL_SOCKET，cmsg_type 字段 设置 为 SCM_RIGHTS， 用 
以 表明 在 传送 访问 权 。(SCM 是 Socket-level Control Message 的 缩写 ， 即 套 接 字 级 控制 消息 。) 访 
问 权 仅 能 通过 UNIX 域 套 接 字 传送 。 描 述 符 紧 随 cmsg_type 字段 之 后 存储 ， 用 CMSG_DATA & 
获得 该 整 型 量 的 指针 。 

在 此 定义 3 个 宏 ， 用 于 访问 控制 数据 ， 一 个 宏 用 于 帮助 计算 cmsg_len 所 使 用 的 值 。 

#include <sys/socket.h> 
unsigned char *CMSG_DATA(struct cmsghdr *cp); 
返回 值 : 返回 一 个 指针 ， 指 向 与 cmsghdr 结构 相关 联 的 数据 


struct cmsghdr *CMSG FIRSTHDR(struct msghdr *mp); 


返回 值 : 返回 一 个 指针 ， 指 向 与 msghdz 结构 相关 联 的 第 一 个 cmsghdr 结构 ; 
若 无 这 样 的 结构 ， 返 回 NULL 


struct cmsghdr *CMSG_NXTHDR(struct msghdr *mp, 
struct cmsghdr *cp); 
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返回 值 : 返回 一 个 指针 , 指向 与 msghdr 结构 相关 联 的 下 一 个 cmsghdr 
结构 ， 该 msghdr 结构 给 出 了 当前 的 cmsghdr 结构 ， 若 当前 
emsghdr 结构 已 是 最 后 一 个 ， 返 回 NULL 


unsigned int CMSG LEN(unsigned int nbytes); 





返回 值 : 返回 为 nbytes 长 的 数据 对 象 分 配 的 长 度 
Single UNIX Specification 定义 了 前 3 个 宏 , 但 没有 定义 CMSG_LEN。 


CMSG LEN 宏 返 回 存储 nbytes 长 的 数据 对 象 所 需 的 字 节 数 ， 它 先 将 nbytes 加 上 cmsghdr 结 
构 的 长 度 ， 然 后 按 处 理 器 体系 结构 的 对 齐 要 求 进行 调整 ， 最 后 再 向 上 取 整 。 
图 17-13 中 的 程序 是 UNIX 域 套 接 字 的 send fd 函数 ， 它 通过 UNIX 域 套 接 字 传递 文件 描述 
符 。sendmsg 调用 被 用 来 传送 协议 数据 (包括 null 字 节 和 状态 字 节 ) 以 及 描述 符 。 


#include "apue.h" 
#include <sys/socket.h> 


/* size of control buffer to send/recv one file descriptor */ 
#define CONTROLLEN CMSG_LEN (sizeof (int) ) 


static struct cmsghdr *cmptr = NULL; /* malloc'ed first time */ 


/* 
* Pass a file descriptor to another process. 
* Tf fd«0, then -fd is sent back instead as the error status. 
+/ 
int 
send_fd(int fd, int fd_to_send) 
{ 
struct iovec iov[1]; 
struct msghdr msg; 


char buf [2]; /* send_fd()/recv_fd() 2-byte protocol */ 
iov[0].iov_base = buf; 

iov[0].iov len m 23 

msg.msg iov - iov; 

msg.msg iovlen = 1; 

msg.msg_name = NULL; 

msg.msg_namelen = 0; 


if (fd_to_send < 0) { 


msg.msg_control = NULL; 

msg.msg_controllen = 0; 

buf[1] = -fd_to_send; /* nonzero status means error */ 

if (buf[1] == 0) 
buf[1] = 1; /* -256, etc. would screw up protocol */ 

) else ( 

if (cmptr == NULL && (cmptr = malloc(CONTROLLEN)) -- NULL) 
return(-1); 

cmptr-»cmsg level = SOL SOCKET; 

cmptr-»cmsg type = SCM RIGHTS; 

cmptr-»cmsg len = CONTROLLEN; 

msg.msg control = cmptr; 


msg.msg_controllen = CONTROLLEN; 
*(int *)CMSG DATA(cmptr) = fd to send; /* the fd to pass */ 
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buf[1] = 0; /* zero status means OK */ 
} 
buf[0] = 0; /* null byte flag to recv fd() */ 
if (sendmsg(fd, &msg, 0) != 2) 


return(-1); 
return(0); 





图 17-13 通过 UNIX 域 套 接 字 发 送 文件 描述 符 
为 了 接收 一 个 文件 描述 符 ( 见 图 17-14), BANA cmsghdr 结构 和 描述 符 分 配 了 足够 大 的 空 
间 ， 设 置 msg_control 指向 该 分 配 到 的 存储 区 ， 然 后 调用 了 recvmsg。 使 用 CMSG_LEN 宏 计 
算 所 需 的 空间 总 量 。 
读 取 UNIX 域 套 接 字 ， 直 至 读 到 null 字 节 ， 它 位 于 最 后 的 状态 字 节 之 前 。null 字 节 之 前 是 一 
条 来 自发 送 者 的 出 错 消 息 。 


#include "apue.h" 
#include <sys/socket.h> /* struct msghdr */ 


/* size of control buffer to send/recv one file descriptor */ 
#define CONTROLLEN CMSG_LEN (sizeof (int) ) 


static struct cmsghdr *cmptr = NULL; /* malloc'ed first time */ 


/* 

* Receive a file descriptor from a server process. Also, any data 
* received is passed to (*userfunc) (STDERR FILENO, buf, nbytes). 

* We have a 2-byte protocol for receiving the fd from send fd(). 
*/ 

int 

recv fd(int fd, ssize t (*userfunc) (int, const void *, size t)) 


( 


int newfd, nr, status; 
char *ptr; 
char buf [MAXLINE]; 
struct iovec iov[1]; 
struct msghdr msg; 
status = -1; 
for (a e Ti 
iov[0] .iov_base = buf; 
iov[0].iov len = sizeof (buf); 
msg.msg iov - iov; 
msg.msg iovlen = 1; 
msg.msg name = NULL; 
msg.msg namelen = 0; 
if (cmptr -- NULL && (cmptr = malloc(CONTROLLEN)) -- NULL) 


return(-1); 


msg.msg control cmptr; 

msg.msg controllen = CONTROLLEN; 

if ((nr = recvmsg(fd, &msg, 0)) < 0) { 
err ret("recvmsg error"); 
return(-1):; 

} else if (nr == 0) ( 





err_ret ("connection closed by server"); 


return (-1); 


) 


/* 
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* See if this is the final data with null & status. Null 
* is next to last byte of buffer; status byte is last byte. 
* Zero status means there is a file descriptor to receive. 


Lrg 
for (ptr = buf; ptr < &buf[nr]; ) { 
if (*ptrt+ == 0) ( 
if (ptr != &buf[nr-1]) 
err_dump("message format error"); 
status = *ptr & OxFF; /* prevent sign extension */ 
if (status == 0) { 
if (msg.msg_controllen < CONTROLLEN) 
err_dump("status = 0 but no fd"); 
newfd = *(int *)CMSG_DATA(cmptr) ; 
} else { 
newfd = -status; 
} 
nr == 2; 
} 
} 
if (nr > 0 && (*userfunc) (STDERR FILENO, buf, nr) !- nr) 
return(-1); 
if (status >= 0) /* final data has arrived */ 
return (newfd) ; /* descriptor, or -status */ 


图 17-14 通过 UNIX 域 套 接 字 接 收文 件 描述 符 


注意 , 该 程序 总 是 准备 接收 一 个 描述 符 (在 每 次 调用 recvmsg 之 前 , 设置 msg_control 
和 msg_controllen), 但 是 仅 当 msg_controllen 返回 的 是 非 0 值 时 ， 才 确实 接收 到 描 


述 符 。 


回忆 serv accept 函数 CWA 17-9) 确定 调用 者 身份 的 步 又。 如果 内 核能 够 把 调用 者 的 证 
书 在 调用 accept 之 后 返回 给 调用 处 会 更 好 。 某 些 UNIX 域 套 接 字 的 实现 提供 类 似 的 功能 ， 但 它 


们 的 接口 不 同 。 


FreeBSD 8.0 和 Linux 3.2.0 都 支持 通过 UNIX 域 套 接 字 发 送 证 书 ， 但 它们 的 实现 方式 不 同 。 


Mac OS X 10.6.8 是 部 分 从 FreeBSD 派生 出 来 的 ， 但 禁止 传送 证 书 。Solaris 10 不 支持 通过 UNIX 


域 套 接 字 传送 证 书 ， 然 而 它 支持 从 一 个 通过 STREAMS 管道 传输 文件 描述 符 的 进程 中 获得 证 书 ， 


这 里 我 们 不 讨论 它 的 细节 。 


在 FreeBSD 中 ， 将 证 书 作 为 cmsgcred 结构 传送 。 


#define CMGROUP_MAX 16 
struct cmsgcred { 


pid_t cmcred_pid; Yi 
uid_t cmcred_uid; /* 
uid_t cmcred_euid; /* 


gid_t cmcred_gid; /* 


sender's 
sender's 
sender's 
sender's 


process ID */ 
real UID */ 
effective UID */ 
real GID */ 
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Short cmcred_ngroups; /* number of groups */ 
gid_t cmcred_groups [CMGROUP_MAX] ; /* groups */ 


[648] Ef 
在 传送 证 书 时 ， 仅 需 为 cmsgcred 结构 保留 存储 空间 。 内 核 将 填充 该 结构 以 防止 应 用 程序 伪装 成 


具有 男 一 种 身份 。 
1E Linux 中 ， 将 证 书 作 为 ucred 结构 传送 。 


struct ucred { 


pid_t pid; /* sender's process ID */ 
uid_t uid; /* sender's user ID */ 
gid_t gid; /* sender's group ID */ 


}; 
与 FreeBSD 不 同 ，Linux 需要 在 传输 前 初始 化 这 个 结构 。 内 核 会 确保 应 用 程序 要 么 能 够 使 用 对 应 
调用 者 的 值 ， 要 么 有 使 用 其 他 值 的 合适 权限 。 

图 17-15 显示 了 更 新 过 后 的 send fd 函数 ， 它 包含 了 发 送 进程 的 证 书 。 


#include "apue.h" 
#include <sys/socket.h> 


#if defined (SCM_CREDS) /* BSD interface */ 
#define CREDSTRUCT cmsgcred 

#define SCM_CREDTYPE SCM_CREDS 

#elif defined(SCM CREDENTIALS) /* Linux interface */ 
#define CREDSTRUCT ucred 

#define SCM CREDTYPE SCM CREDENTIALS 

#else 

#error passing credentials is unsupported! 

#endif 


/* size of control buffer to send/recv one file descriptor */ 
#define RIGHTSLEN CMSG_LEN (sizeof (int) ) 

#define CREDSLEN CMSG_LEN (sizeof (struct CREDSTRUCT) ) 
#define CONTROLLEN (RIGHTSLEN + CREDSLEN) 


static struct cmsghdr *cmptr = NULL; /* malloc'ed first time */ 


/* 
* Pass a file descriptor to another process. 
* If fd«0, then -fd is sent back instead as the error status. 
*/ 
int 
send fd(int fd, int fd to send) 
{ 
struct CREDSTRUCT *credp; 


struct cmsghdr *cmp; 

struct iovec iov[1]; 

struct msghdr msg; 

char buf[2]; /* send fd/recv ufd 2-byte protocol */ 


iov[0].iov base - buf; 
2; 
msg.msg iov iov; 


msg.msg iovlen = 1; 


iov[0].iov len 
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msg.msg_name = NULL; 
msg.msg_namelen = 0; 
msg.msg_flags = 0; 

if (fd_to_send < 0) { 


msg.msg_control = NULL; 
msg.msg_controllen = 0; 
buf[1] = -fd_to_send; /* nonzero status means error */ 
if (buf[1] == 0) 
buf[1] = 1; /* -256, etc. would screw up protocol */ 
} else { 
if (cmptr == NULL && (cmptr = malloc(CONTROLLEN)) == NULL) 


return (-1); 
msg.msg control - cmptr; 
msg.msg controllen = CONTROLLEN; 
cmp = cmptr; 
cmp->cmsg_level = SOL_SOCKET; 


cmp->cmsg_type = SCM_RIGHTS; 
cmp->cmsg_len = RIGHTSLEN; 
*(int *)CMSG_DATA(cmp) = fd_to_send; /* the fd to pass */ 


cmp = CMSG_NXTHDR(&msg, cmp); 

cmp->cmsg_level = SOL SOCKET; 

cmp->cmsg_type SCM_CREDTYPE; 

cmp->cmsg_len CREDSLEN; 

credp = (struct CREDSTRUCT *)CMSG DATA(cmp); 
#if defined(SCM CREDENTIALS) 

credp-»uid = geteuid(); 


credp->gid = getegid(); 
credp->pid = getpid(); 
#endif 
buf[1] = 0; /* zero status means OK */ 
} 
buf[0] = 0; /* null byte flag to recv_ufd() */ 
if (sendmsg(fd, &msg, 0) != 2) 


return (-1); 
return (0); 


17-15 ”通过 UNIX 域 套 接 字 发 送 证 书 


注意 ， 只 有 在 Linux 上 才 需 要 初始 化 证 书 结构 。 
图 17-16 中 的 recv_ufd 函数 是 recv_fd 的 修改 版 ， 它 通过 一 个 引用 参数 返回 发 送 者 的 用 户 ID。 





#include "apue.h" 
#include <sys/socket.h> /* struct msghdr */ 
#include <sys/un.h> 


#if defined (SCM CREDS) /* BSD interface */ 
#define CREDSTRUCT cmsgcred 

#define CR_UID cmcred_uid 

#define SCM_CREDTYPE SCM_CREDS 

#elif defined(SCM CREDENTIALS) /* Linux interface */ 
#define CREDSTRUCT ucred 

#define CR UID uid 

#define CREDOPT SO PASSCRED 

#define SCM CREDTYPE SCM CREDENTIALS 


#else 
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#error passing credentials is unsupported! 
#endif 


/* size of control buffer to send/recv one file descriptor */ 
#define RIGHTSLEN CMSG_LEN (sizeof (int) ) 

#define CREDSLEN CMSG LEN (sizeof (struct CREDSTRUCT) ) 
#define CONTROLLEN (RIGHTSLEN + CREDSLEN) 


static struct cmsghdr *cmptr = NULL; /* malloc'ed first time */ 


/* 
* Receive a file descriptor from a server process. Also, any data 
* received is passed to (*userfunc) (STDERR FILENO, buf, nbytes). 
* We have a 2-byte protocol for receiving the fd from send fd(). 
wif 
int 
recv_ufd(int fd, uid_t *uidptr, 
ssize t (*userfunc) (int, const void *, size t)) 


struct cmsghdr *cmp; 

struct CREDSTRUCT *credp; 

char "ptr? 

char buf [MAXLINE] ; 

struct iovec iov[1]; 

struct msghdr msg; 

int nr; 

int newfd = -1; 

int status = -1; 
#if defined (CREDOPT) 

const int on = 1; 


if (setsockopt (fd, SOL SOCKET, CREDOPT, &on, sizeof(int)) < 0) { 
err_ret("setsockopt error"); 
return (-1); 
} 
#endif 
Loe CF. Poi 
iov[0].iov_base = buf; 


iov[0].iov len = sizeof (buf); 
msg.msg_iov = iov; 
msg.msg_iovlen = 1; 
msg.msg_name = NULL; 


msg.msg_namelen = 0; 
if (cmptr == NULL && (cmptr = malloc(CONTROLLEN)) == NULL) 
return (-1); 


msg.msg_control cmptr; 
msg.msg_controllen = CONTROLLEN; 
if ((nr = recvmsg(fd, &msg, 0)) < 0) { 
err ret("recvmsg error"); 
return(-1); 
) else if (nr == 0) { 
err ret("connection closed by server"); 
return(-1); 
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/* 

* See if this is the final data with null & status. Null 

* is next to last byte of buffer; status byte is last byte. 
* Zero status means there is a file descriptor to receive. 


*/ 
for (ptr = buf; ptr < &buf[nr]; ) ( 
if (*ptr++ == 0) { 
if (ptr != &buf[nr-1]) 
err dump("message format error"); 
Status - *ptr & OxFF; /* prevent sign extension */ 
if (status == 0) { 
if (msg.msg_controllen != CONTROLLEN) 
err_dump("status = 0 but no fd"); 
/* process the control data */ 
for (cmp = CMSG FIRSTHDR(&msg) ; 
cmp != NULL; cmp = CMSG_NXTHDR(&msg, cmp)) { 
if (cmp->cmsg_level != SOL_SOCKET) 
continue; 
switch (cmp->cmsg_type) { 
case SCM RIGHTS: 
newfd = *(int *)CMSG DATA(cmp); 
break; 
case SCM CREDTYPE: 
credp - (struct CREDSTRUCT *)CMSG DATA(cmp); 
*uidptr = credp-»CR UID; 
) 
} 
} else { 
newfd = -status; 
} 
nr == 2; 
} 
} 
if (nr > 0 && (*userfunc) (STDERR_FILENO, buf, nr) != nr) 
return(-1); 
if (status >= 0) /* final data has arrived */ 
return (newfd) ; /* descriptor, or -status */ 


图 17-16 通过 UNIX 域 套 接 字 接收 证 书 
在 FreeBSD 中 ， 指 定 SCM CREDS 表示 要 传送 证 书 。 在 Linux 中 ， 则 使 用 SCM CREDENTIALS. 


17.5 open 服务 器 进程 第 1 版 


使 用 文件 描述 符 传 送 技术 开发 一 个 open 服务 器 进程 一 一 一 个 由 一 个 进程 执行 以 打开 一 个 或 
多 个 文件 。 该 服务 器 进程 不 是 将 文件 内 容 送 回调 用 进程 ， 而 是 送 回 一 个 打开 文件 描述 符 。 这 使 该 
服务 器 进程 对 任何 类 型 的 文件 〈 如 设备 或 套 接 字 ) 而 不 单 是 普通 文件 都 能 起 作用 。 客 户 进程 和 服 
务 器 进程 用 IPC 交换 最 小 量 的 信息 : 从 客户 进程 到 服务 器 进程 传送 文件 名 和 打开 模式 ， 而 从 服务 
器 进程 到 客户 进程 返回 描述 符 。 文 件 内 容 不 需 通过 IPC 交换 。 
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将 服务 器 进程 设计 成 一 个 单独 的 可 执行 程序 (或 者 是 由 客户 进程 执行 的 ， 这 正 是 本 节 所 说 明 
的 ; 或 者 是 由 守护 服务 器 进程 执行 的 ， 将 在 下 一 节 进 行 说 明 ) 有 很 多 优点 。 
。 任何 客户 进程 都 能 很 容易 地 和 服务 器 进程 联系 ， 这 类 似 于 客户 进程 调用 一 个 库 函 数 。 我 
们 没有 将 特定 服务 硬 编码 在 应 用 程序 中 ， 而 是 设计 了 一 种 可 供 重 用 的 设施 。 
。 如 若 需 要 更 改 服务 器 进程 ， 那 么 也 只 影响 一 个 程序 。 相 反 ， 更 新 一 个 库 函 数 可 能 需要 更 
新 调用 此 库 函 数 的 所 有 程序 〈 即 用 连接 编辑 器 重新 连接 )。 共 享 库 函 数 可 以 简化 这 种 更 新 
(WL 7.7 555. 
。 服务 器 进程 可 以 是 一 个 设置 用 户 ID 程序 ， 于 是 使 其 具有 客户 进程 没有 的 附加 权限 。 注 意 ， 
库 函 数 〈 或 共享 库 函 数 ) 不 能 提供 这 种 能 力 。 
客户 进程 创建 一 个 fd 管道 ， 然 后 调用 fork 和 exec 来 调用 服务 器 进程 。 客 户 进程 使 用 一 端 
经 fd 管道 发 送 请 求 ， 服 务 器 进程 使 用 男 一 端 经 fd 管道 回 送 响应 。 
定义 客户 进程 和 服务 器 进程 间 的 应 用 程序 协议 如 下 。 
CD 客户 进程 通过 fd 管道 向 服务 器 进程 发 送 “open <pathname> <openmode>\0” 形 式 的 请 
求 。<openmode> 是 数值 ， 以 ASCII 十 进 制 数 表示 ， 是 open 函数 的 第 二 个 参数 。 该 请 求 字 符 串 以 
null 字符 终止 。 
(2) 服务 器 进程 调用 send. £d BK send. err 回 送 打开 描述 符 或 出 错 消息 。 
这 是 一 个 进程 向 其 父 进程 发 送 打 开 描述 符 的 实例 。17.6 节 将 修改 此 实例 来 使 用 一 个 守护 服务 
器 进程 ， 它 的 服务 器 进程 将 一 个 描述 符 发 送 给 一 个 完全 无 关 的 进程 。 
首先 要 有 一 个 头 文件 open .h 〈 见 图 17-17)， 它 包括 标准 头 文件 ， 并 且 定 义 了 函数 原型 。 


#include "apue.h" 
#include <errno.h> 


#define CL_OPEN "open" /* client's request for server */ 
int csopen(char *, int); 
图 17-17 open. h 头 文件 


main 函数 〈 见 图 17-18) 是 一 个 循环 ， 它 先 从 标准 输入 读 一 个 路 径 名 ， 然 后 将 该 文件 复制 到 
标准 输出 。 它 调用 csopen 函数 来 联系 open 服务 器 进程 ， 从 其 返回 一 个 打开 描述 符 。 


#include "open.h" 
#include «fcntl.h» 
#define BUFFSIZE 8192 
int 


main(int argc, char *argv[]) 


{ 


int My. as 
char buf [BUFFSIZE]; 
char line [MAXLINE]; 


/* read filename to cat from stdin */ 
while (fgets(line, MAXLINE, stdin) != NULL) { 
if (line[strlen(line) - 1] == '\n') 
line[strlen(line) - 1] = 0; /* replace newline with null */ 
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/* open the file */ 
if ((fd = csopen(line, O_RDONLY)) < 0) 
continue; /* csopen() prints error from server */ 


/* and cat to stdout */ 
while ((n = read(fd, buf, BUFFSIZE)) > 0) 


if (write(STDOUT_FILENO, buf, n) != n) 
err_sys ("write error"); 
if (n < 0) 
err_sys("read error"); 
close(fd); 


exit (0); 


17-18 main 函数 
函数 csopen (JL 17-19) 在 创建 了 人 包 管 道 之 后 ， 进 行 了 服务 器 进程 的 fork 和 exec 操作 。 


#include "open.h" 
#include <sys/uio.h> /* struct iovec */ 
/* 


* Open the file by sending the "name" and "oflag" to the 
* connection server and reading a file descriptor back. 
wf 

int 

csopen(char *name, int oflag) 


{ 


pid_t pid; 

int len; 
char buf[10]; 

struct iovec iov[3]; 

static int £d[2] = = <1. ty 

if (fd[0] < 0) { /* fork/exec our open server first time */ 


if (fd_pipe(fd) < 0) { 
err ret("fd pipe error"); 
return(-1); 

) 

if ((pid = fork()) « 0) { 
err ret("fork error"); 
return(-1); 


) else if (pid == 0) ( /* Child. */ 
close (fd[0]); 
if (fd[1] != STDIN FILENO && 
dup2(fd[1], STDIN FILENO) != STDIN FILENO) 
err sys("dup2 error to stdin"); 
if (fd[1] != STDOUT FILENO && 
dup2(fd[1], STDOUT FILENO) !- STDOUT FILENO) 


err sys("dup2 error to stdout"); 
if (execl("./opend", "opend", (char *)0) « 0) 
err sys("execl error"); 
) 
close (fd[1]); /* parent */ 
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} 

sprintf (buf, " %d", oflag); /* oflag to ascii */ 
iov[0].iov base = CL OPEN " "; /* string concatenation */ 
iov[0].iov len = strlen(CL OPEN) + 1; 

iov[1].iov base = name; 


iov[1].iov len = strlen(name); 

iov[2].iov base = buf; 

iov[2].iov len = strlen(buf) + 1; /* +1 for null at end of buf */ 
len = iov[0].iov len + iov[1].iov len + iov[2].iov len; 

if (writev(fd[0], &iov[0], 3) != len) { 


err ret("writev error"); 
return(-1); 


} 


/* read descriptor, returned errors handled by write() */ 
return (recv_fd(fd[0], write)); 


图 17-19 csopen 函数 

子 进程 关闭 fd 管道 的 一 端 ， 父 进程 关闭 另 一 端 。 作 为 服务 器 进程 ， 子 进程 也 将 fd 管道 的 一 
端 复制 到 其 标准 输入 和 标准 输出 。( 另 一 种 可 选择 的 方案 是 ， 将 描述 符 fda[1] 的 ASCU 表示 形式 
作为 一 个 参数 传送 给 服务 器 进程 。) 

父 进程 将 包含 路 径 名 和 打开 模式 的 请 求 发 送 给 服务 器 进程 。 最 后 ， 父 进程 调用 recv_fd 返回 描 
述 符 或 出 错 消 息 。 如 果 服 务 器 进程 返回 出 错 消息 ， 那 么 父 进程 调用 write， 向 标准 错误 输出 该 消息 。 

现在 ， 让 我 们 来 看 看 open 服务 器 进程 。 其 程序 是 opend， 由 图 17-19 中 的 子 进程 执行 。 首 先 ， 
要 有 一 个 opend.h 头 文件 〈 见 图 17-20)， 它 包括 标准 头 文件 ， 并 且 声 明了 全 局 变量 和 函数 原型 。 


#include "apue.h" 
#include <errno.h> 


#define CL_OPEN "open" /* client's request for server */ 

extern char errmsg[]; /* error message string to return to client */ 
extern int oflag; 7* epen() Elagi O xxx ... */ 

extern char  *pathname; /* of file to open() for client */ 

int cli args(int, char **); 

void handle request(char *, int, int); 


图 17-20 opend.h 头 文件 
main PAX (WLAN 17-21) 经 fd 管道 〈 它 的 标准 输入 ) 读 来 自 客户 进程 的 请 求 ， 然 后 调用 函 
Xt handle request. 


#include "opend .hy 
char errmsg [MAXLINE] ; 
int oflag; 

char *pathname; 

int 


main (void) 


{ 
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int nread; 
char buf [MAXLINE] ; 
for (; ; ) {/* read arg buffer from client, process request */ 


if ((nread = read(STDIN FILENO, buf, MAXLINE)) < 0) 
err_sys ("read error on stream pipe"); 
else if (nread == 0) 
break; /* client has closed the stream pipe */ 
handle_request (buf, nread, STDOUT_FILENO) ; 


) 
exit(0); 
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图 17-22 中 的 handle_request 函数 承担 了 全 部 工作 。 它 调用 函数 buf_args 将 客户 进程 请 求 分 
解 成 标准 argv 型 的 参数 表 ， 然 后 调用 函数 cli args 处 理 客户 进程 的 参数 。 如 果 一 切 正常 ， 则 调用 
open 打开 相应 文件 ， 接 着 调用 send fd, Amh fd 管道 〈 它 的 标准 输出 ) 将 描述 符 回 送 给 客户 进程 。 

如 果 出 错 则 调用 send err 回 送 一 则 出 错 消 息 ， 其 中 使 用 了 前 面 说 明 的 客户 进程 -服务 器 进程 协议 。 656 


#include "opend.h" 
#include <fentl.h> 
void 


handle request(char *buf, int nread, int fd) 


{ 


int newfd; 


if (buf[nread-1] != 0) { 
snprintf (errmsg, MAXLINE-1, 
"request not null terminated: %*.*s\n", nread, nread, buf); 
send err(fd, -1, errmsg); 
return; 
) 
if (buf args(buf, cli args) < 0) ( /* parse args & set options */ 
send err(fd, -1, errmsg); 
return; 
} 
if ((newfd = open (pathname, oflag)) < 0) { 
snprintf (errmsg, MAXLINE-1, "can't open %s: %s\n", pathname, 
strerror (errno) ); 
send_err(fd, -1, errmsg); 


return; 

} 

if (send_fd(fd, newfd) < 0) /* send the descriptor */ 
err_sys("send_fd error"); 

close (newfd) ; /* we're done with descriptor */ 





图 17-22 handle request 函数 第 1 版 


客户 进程 请 求 是 一 个 以 null. 终止 的 字符 串 ， 它 包含 由 空格 分 隔 的 参数 。 图 17-23 中 的 buf_ 
args 函数 将 字符 串 分 解 成 标准 argv 型 参数 表 ， 并 调用 用 户 函数 处 理 参数 。 我 们 使 用 ISO C R 
数 strtok 将 字符 串 分 割 成 独立 的 参数 。 
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#include "apue.h" 


#define MAXARGC 50 /* max number of arguments in buf */ 
#define WHITE "\t\n" /* white space for tokenizing arguments */ 
/* 


buf[] contains white-space-separated arguments. We convert it to an 
* argv-style array of pointers, and call the user's function (optfunc) 
* to process the array. We return -1 if there's a problem parsing buf, 
* else we return whatever optfunc() returns. Note that user's buf[] 

* array is modified (nulls placed after each token). 

^y. 

int 

buf args(char *buf, int (*optfunc) (int, char **)) 


í 


char *ptr, *argv[MAXARGC]; 
int argc; 
if (strtok(buf, WHITE) == NULL) /* an argv[0] is required */ 
return(-1); 
argv[argc = 0] = buf; 
while ((ptr = strtok(NULL, WHITE)) != NULL) { 
if (**argc >= MAXARGC-1) /* -1 for room for NULL at end */ 


return(-1); 
argv[argc] = ptr; 
) 
argv[**argc] = NULL; 


/* 

* Since argv[] pointers point into the user's buf[], 
* user's function can just copy the pointers, even 

* though argv[] array will disappear on return. 

f 


return((*optfunc) (argc, argv)); 





图 17-23 buf args 函数 


buf args 调用 的 服务 器 进程 函数 是 cli args (WAR 17-24)。 它 验证 客户 进程 发 送 的 参数 
个 数 是 否 正 确 ， 然 后 将 路 径 名 和 打开 模式 存储 在 全 局 变量 中 。 


#include "opend.h" 





/* 

* This function is called by buf_args(), which is called by 
* handle_request(). buf_args() has broken up the client's 
* buffer into an argv[]-style array, which we now process. 
kf 

int 


cli args(int argc, char **argv) 
{ 
if (argc != 3 || strcmp(argv[0], CL OPEN) != 0) { 
strcpy(errmsg, "usage: <pathname> <oflag>\n"); 
return(-1); 
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pathname = argv[1]; /* save ptr to pathname to open */ 
oflag = atoi(argv[2]); 
return (0); 


图 17-24 cli args 函数 
这 样 也 就 完成 了 open 服务 器 进程 ， 它 由 客户 进程 执行 fork 和 exec 来 调用 。 在 fork ZH 
创建 了 一 个 志 管 道 , 然后 客户 进程 和 服务 器 进程 用 其 进行 通信 。 在 这 种 安排 下 ,每 个 客户 进程 都 
有 一 个 服务 器 进程 。 658 
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在 上 一 节 中 ， 我 们 开发 了 一 个 open 服务 器 进程 ， 由 客户 进程 执行 fork 和 exec 调用 ， 它 说 
明了 如 何 从 子 程序 向 父 程序 传送 文件 描述 符 。 本 节 将 开发 一 个 守护 进程 方式 的 open 服务 器 进程 。 
一 个 服务 器 进程 处 理 所 有 客户 进程 的 请 求 。 由 于 避免 了 使 用 fork 和 exec， 我 们 期 望 这 个 设计 
会 更 有 效 。 在 客户 进程 和 服务 器 进程 之 间 仍 使 用 UNIX 域 套 接 字 连接 ， 并 用 实例 说 明 在 两 个 无 关 
进程 之 间 如 何 传送 文件 描述 符 。 我 们 将 使 用 17.3 节 引 入 的 3 个 函数 : serv listen. serv_ 
accept 和 cli_conn。 这 个 服务 器 进程 还 将 演示 一 个 服务 器 进程 如 何 处 理 多 个 客户 进程 ， 为 此 
要 用 到 14.4 节 中 说 明 的 select 和 poll 函数 。 

本 节 所 述 的 客户 进程 类 似 于 17.5 节 中 的 客户 进程 。 实 际 上 , 文件 main .c 是 完全 相同 的 ( 见 
图 17-18)。 我 们 将 在 open .h 头 文件 〈 见 图 17-17〉 中 加 入 下 面 这 行 : 


#define CS_OPEN "/tmp/opend.socket" /* server's well-known name */ 


因为 在 此 例 中 调用 的 是 cli conn 而 非 fork 和 exec, 所 以 文件 open.c 4M 17-19 中 的 不 同 。 
修改 后 如 图 17-25 所 示 。 


#include "open.h" 
#include <sys/uio.h> /* struct iovec */ 
/* 


* Open the file by sending the "name" and "oflag" to the 
* connection server and reading a file descriptor back. 
ci 

int 

csopen (char *name, int oflag) 


{ 


int len; 

char buf [12]; 

struct iovec iov[3]; 

static int csfd = -1; 

if (csfd < 0) { /* open connection to conn server */ 


if ((csfd = cli_conn(CS_OPEN)) < 0) { 
err ret("cli conn error"); 
return(-1); 


) 


sprintf(buf, " $d", oflag); /* oflag to ascii */ 
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iov[0].iov base = CL OPEN " "; /* string concatenation */ 
iov[0].iov len = strlen(CL OPEN) + 1; 

iov[1].iov base - name; 

iov[1].iov len = strlen(name); 

iov[2].iov base - buf; 

iov[2].iov len = strlen(buf) + 1; /* null always sent */ 
len = iov[0].iov len + iov[1].iov len + iov[2].iov len; 
if (writev(csfd, &iov[0], 3) != len) { 


err ret("writev error"); 
return(-1); 


/* read back descriptor; returned errors handled by write() */ 
return(recv fd(csfd, write)); 


17-25. csopen 函数 第 2 版 
客户 进程 与 服务 器 进程 之 间 使 用 的 协议 仍然 相同 。 
接 下 来 再 看 服务 器 进程 。 头 文件 opend.h (WAR 17-26) 包括 了 标准 头 文件 ， 并 且 声 明了 全 


#include "apue.h" 
#include <errno.h> 


#define CS_OPEN "/tmp/opend.socket" /* well-known name */ 
#define CL OPEN "open" /* client's request for server */ 
extern int debug; /* nonzero if interactive (not daemon) */ 
extern char errmsg[]; /* error message string to return to client */ 
extern int oflag; /* open flag: O xxx ... */ 
extern char  *pathname; /* of file to open for client */ 
typedef struct { /* one Client struct per connected client */ 
int fd; /* fd, or -1 if available */ 
uid t uid; 
) Client; 
extern Client*client; /* ptr to malloc'ed array */ 
extern int client size; /* # entries in client[] array */ 
int cli args(int, char **); 
int client add(int, uid t); 
void client del(int); 
void loop(void); 
void handle request(char *, int, int, uid t); 





图 17-26 opend.h 头 文件 第 2 版 


因为 此 服务 器 进程 处 理 所 有 客户 进程 ， 所 以 它 必须 保存 每 个 客户 进程 连接 的 状态 。 这 是 用 在 
opend.h 头 文件 中 声明 的 client 数组 实现 的 。 图 17-27 定义 了 3 个 处 理 此 数组 的 函数 。 





#include "opend.h" 


#define NALLOC 10 /* # client structs to alloc/realloc for */ 
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static void 


client_alloc(void) /* alloc more entries in the client[] array */ 
{ 
int i; 
if (client == NULL) 
client = malloc(NALLOC * sizeof (Client) ); 
else 
client = realloc(client, (client_size+NALLOC) *sizeof (Client) ); 
if (client == NULL) 


err_sys("can't alloc for client array"); 


/* initialize the new entries */ 
for (i = client size; i < client size + NALLOC; i++) 
client[i].fd = -1; /* fd of -1 means entry available */ 


client size += NALLOC; 


/* 
* Called by loop() when connection request from a new client arrives. 
*/ 

int 

client_add(int fd, uid_t uid) 

{ 


int i; 
if (client == NULL) /* first time we're called */ 
client_alloc(); 
again: 
for (i = 0; i < client_size; i++) { 


if (client[i].fd == -1) ( /* find an available entry */ 
client[i].fd = fd; 
client[i].uid = uid; 
return(i);/* return index in client[] array */ 


/* client array full, time to realloc for more */ 
client alloc(); 


goto again; /* and search again (will work this time) */ 
} 
/* 
* Called by loop() when we're done with a client. 
EJ 
void 


client_del (int fd) 
{ 


int ij 


for (i = 0; i < client size; i++} ( 
if (client[i].fd -- fd) ( 
client[i].fd = -1; 
return; 
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} 
} 
log quit("can't find client entry for fd $d", fd); 


图 17-27 处理 client 数组 的 3 个 函数 

第 一 次 调用 client add Hl. 它 调用 client_alloc, client_alloc 又 调用 malloc 为 
该 数组 的 10 个 登记 项 分 配 空间 。 在 这 10 个 登记 项 全 部 用 完 后 ， 如 若 再 调用 client add, MA 
client_alloc 函数 将 调用 realloc 来 分 配 附加 空间 。 依 靠 这 种 动态 空间 分 配 ， 我 们 无 需 在 编 
译 时 将 估计 的 数组 长 度 值 放 入 头 文件 中 从 而 限制 client 数组 的 长 度 。 如 果 出 错 ， 这 些 函 数 将 调 
用 log 函数 〈 见 附录 B)， 因 为 我 们 假定 服务 器 进程 是 守护 进程 。 

通常 服务 器 进程 会 作为 守护 进程 运行 ， 但 我 们 想 提 供 一 个 让 其 前 台 运 行 的 选项 ， 同 时 能 够 把 
分 析 信 息 发 送 到 标准 错误 输出 。 这 应 该 能 使 服务 器 更 容易 评测 和 调试 ， 特 别 是 当 用 户 没有 权限 读 
取 那 些 分 析 信息 经 常 写 入 的 日 志文 件 时 。 可 以 使 用 一 个 命令 行 选项 来 控制 服务 器 是 否 在 前 台 运 行 
或 者 作为 守护 进程 在 后 台 运 行 。 

一 个 系统 的 所 有 命令 遵循 相同 的 约定 是 非常 重要 的 ， 因 为 这 会 提高 它 的 易 用 性 。 如 果 有 人 熟 
悉 某 条 命令 的 选项 风格 ， 那 么 车 后 面 的 命令 使 用 了 其 他 的 风格 ， 他 就 很 容易 犯错 。 

处 理 命 令 行 空格 就 很 容易 发 生 这 样 的 问题 。 有 些 命令 需要 它 的 选项 和 其 参数 以 空格 隔 开 ， 而 
男 一 些 则 希望 它 的 参数 直接 跟 在 它 的 选项 之 后 。 如 果 没 有 遵循 一 个 一 致 的 规则 ， 用 户 就 得 记 住所 
有 命令 的 语法 ， 或 者 在 尝试 和 调 错 中 调用 这 些 命令 。 

Single UNIX Specification 包括 了 一 系列 的 约定 和 规范 来 保证 命令 行 语法 的 一 致 性 ， 其 中 包括 一 些 建 
议 ， 如 “限制 每 个 命令 行 选项 为 一 个 单一 的 阿拉 伯 字 符 ” 以 及 “所 有 选项 必须 以 “-” 作 为 开头 字符 ”。 

幸运 的 是 ，getopt 函数 能 够 帮助 命令 开发 者 以 一 致 的 方式 处 理 命令 行 选项 。 
#include <unistd.h> 
int getopt (int argc, char * const argv[], const char *options); 
extern int optind, opterr, optopt; 


extern char *optarg; 





返回 值 : 若 所 有 选项 被 处 理 完 ， 返 回 -1， 和 否则 ， 返 回 下 一 个 选项 字符 


参数 arge 和 argv 与 传 入 main 函数 的 一 样 。options 参数 是 一 个 包含 该 命令 支持 的 选项 字符 
的 字符 串 。 如 果 一 个 选项 字符 后 面 接 了 一 个 冒号 ， 则 表示 该 选项 需要 参数 ， 否 则 ， 该 选项 不 需要 
额外 参数 。 举 例 来 说 ， 如 果 一 条 命令 的 用 法 说 明 如 下 : 


command [-i] [-u username] [-z] filename 


则 我 们 可 以 给 getopt 传送 一 个 "iu:z" 作 为 options 字符 串 。 

函数 getopt 一 般 用 在 循环 体内 ， 循 环 直到 getopt 返回 -1 时 退出 。 每 次 迭代 中 ，getopt 
会 返回 下 一 个 选项 。 应 用 程序 负责 筛选 这 些 选 项 ， 判 断 是 和 否 有 冲突 ，getopt 仅 负责 解释 选项 并 
保证 一 个 标准 的 格式 。 

当 遇 到 无 效 的 选项 时 ，getopt 返回 一 个 问题 标记 (question mark) 而 不 是 这 个 字符 。 如 果 选 项 缺 
少 参数 ，getopt 也 会 返回 一 个 问题 标记 ， 但 如 果 选 项 字符 串 的 第 一 个 字符 是 冒号 ，getopt 会 直接 返 
回 冒号 。 而 特殊 的 “--” 格 式 则 会 导致 getopt 停止 处 理 选项 并 返回 -1。 这 允许 用 户 传递 以 “-” 开 头 
但 不 是 选项 的 参数 。 例 如 ， 如 果 有 一 个 名 字 为 “-bar” 的 文件 ， 下 面 的 命令 行 是 无 法 删除 这 个 文件 的 : 
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rm -bar 
因为 rm 会 试图 把 -bar 解释 为 选项 。 正 确 的 删除 文件 的 命令 应 该 是 : 
rm == -bar 


getopt 函数 支持 以 下 4 个 外 部 变量 。 
optarg 如 果 一 个 选项 需要 参数 , 在 处 理 该 选项 时 ,getopt 会 设置 optarg 指向 该 选项 的 
参数 字符 串 。 
opterr 如 果 一 个 选项 发 生 了 错误 ，getopt 会 默认 打印 一 条 出 错 消 息 。 应 用 程序 可 以 通过 
设置 opterr 参数 为 0 来 禁止 这 个 行为 。 
optind 用 来 存放 下 一 个 要 处 理 的 字符 串 在 argv 数组 里 的 下 标 。 它 从 1 开始 , 每 处 理 一 个 
BR, getopt 都 会 对 其 递增 1. 
optopt 如果 处 理 选项 时 发 生 了 错误 ，getopt 会 设置 optopt 指向 导致 出 错 的 选项 字符 串 。 
open 服务 器 进程 的 main 函数 ( 见 图 17-280 定义 全 局 变量 , 处 理 命令 行 选项 , 并 且 调 用 Loop 
函数 。 如 果 以 -da 选项 调用 服务 器 进程 ， 则 服务 器 进程 将 以 交互 方式 运行 而 非 守 护 进程 方式 。 测 试 
服务 器 进程 时 会 用 到 这 个 选项 。 


#include "opend.h" 

#include <syslog.h> 

int debug, oflag, client_size, log_to_stderr; 

char errmsg [MAXLINE]; 

char *pathname; 

Client *client = NULL; 
int 


main(int argc, char *argv[]) 
{ 
int Cc; 


log open("open.serv", LOG PID, LOG USER); 


opterr - 0; /* don't want getopt() writing to stderr */ 
while ((c = getopt(argc, argv, "d")) != EOF) { 
switch (c) { 
case 'd': /* debug */ 
debug = log_to_stderr = 1; 
break; 
case '?': 
err_quit ("unrecognized option: -%c", optopt); 


} 
} 


if (debug == 0) 
daemonize ("opend") ; 


loop (); /* never returns */ 


图 17-28 ”服务 器 进程 main 函数 第 2 版 


538 第 17 章 高 级 进程 间 通 信 


loop 函数 是 服务 器 进程 的 无 限 循环 。 我 们 将 给 出 该 函数 的 两 种 版 本 。 图 17-29 是 使 用 select 
的 一 种 版 本 。 图 17-30 所 示 的 程序 是 使 用 po11 的 另 一 种 版 本 。 


#include "opend.h" 
#include <sys/select.h> 
void 


loop (void) 
{ 


int i, n, maxfd, maxi, listenfd, clifd, nread; 
char buf [MAXLINE]; 
uid t uid; 


fd set rset, allset; 
FD ZERO(&allset); 


/* obtain fd to listen for client requests on */ 
if ((listenfd = serv listen(CS OPEN)) < O0) 
log sys("serv listen error"); 
FD SET(listenfd, &allset); 
maxfd = listenfd; 


maxi = -1; 


for ( v? $ 2 1 
rset - allset; /* rset gets modified each time around */ 
if ((n = select(maxfd + 1, &rset, NULL, NULL, NULL)) < 0) 
log sys("select error"); 


if (FD ISSET(listenfd, &rset)) ( 
/* accept new client request */ 
if ((clifd = serv accept(listenfd, &uid)) < 0) 
log sys("serv accept error: $d", clifd); 
i = client add(clifd, uid); 
FD SET(clifd, &allset); 
if (clifd » maxfd) 


maxfd - clifd; /* max fd for select() */ 
if (i » maxi) 
maxi - i; /* max index in client[] array */ 
log msg("new connection: uid $d, fd $d", uid, clifd); 
continue; 
) 
for (i = 0; i <= maxi; i++) { /* go through client[] array */ 
if ((clifd = client[i].fd) < 0) 
continue; 


if (FD_ISSET(clifd, &rset)) { 
/* read argument buffer from client */ 
if ((nread = read(clifd, buf, MAXLINE)) < 0) { 
log sys("read error on fd $d", clifd); 
} else if (nread == 0) { 
log msg("closed: uid $d, fd %d", 
client [i] uid, clird); 
client del(clifd);/* client has closed cxn */ 
FD CLR(clifd, &allset); 
close (clifd); 
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} else { /* process client's request */ 
handle_request (buf, nread, clifd, client[i].uid); 
} 





图 17-29 使 用 select 的 loop 函数 

此 函数 调用 serv_listen( 见 图 17-8) 创建 服务 器 进程 与 客户 进程 连接 的 端点 。 此 函 
数 的 其 余部 分 是 一 个 循环 ， 它 从 select 调用 开始 。 在 select 返回 后 ， 可 能 会 发 生 下 面 
两 种 情况 。 

(1) 描述 符 listenfd 可 以 随时 读 取 ， 这 意味 着 一 个 新 客户 进程 已 调用 了 cli conn. Af 
处 理 这 种 情况 , 我 们 将 调用 serv accept ( 见 图 17-9)， 然 后 为 新 客户 进程 更 新 client 数组 以 
及 与 该 新 客户 进程 相关 的 短 记 信息 。( 我 们 要 跟踪 select 的 第 一 个 参数 的 最 高 描述 符 编号 ， 还 
要 跟踪 使 用 中 的 client 数组 的 最 高 下 标 。) 

(2) 一 个 现 有 的 客户 进程 的 连接 可 以 随时 读 取 。 这 意味 着 该 客户 进程 已 经 终止 ， 或 者 该 客户 
进程 已 发 送 一 个 新 请 求 。 如 果 read 返回 0 文件 结束 )， 则 表示 客户 进程 已 终止 。 如 果 read ik 
回 的 值 大 于 0， 则 表示 有 一 个 新 请 求 需 处 理 ， 可 以 调用 request 来 处 理 。 

用 allset 描述 符 集 跟踪 当前 使 用 的 描述 符 。 当 新 客户 进程 连接 至 服务 器 进程 时 ， 会 打开 此 
描述 符 集 的 相应 位 。 当 该 客户 进程 终止 时 ， 会 关闭 相应 位 。 

因为 客户 进程 的 所 有 描述 符 都 由 内 核 自 动 关 闭 〈 包 括 与 服务 器 进程 的 连接 )， 所 以 我 们 总 能 
知道 什么 时 候 客 户 进程 终止 了 ， 该 终止 是 否 是 自愿 的 。 这 与 XSI IPC 机 制 不 同 。 

使 用 poll 函数 的 loop 函数 如 图 17-30 Aras. 


#include "opend.h" 
#include <poll.h> 


#define NALLOC 10 /* # pollfd structs to alloc/realloc */ 
static struct pollfd * 


grow_pollfd(struct pollfd *pfd, int *maxfd) 
{ 


int ir 

int oldmax = *maxfd; 

int newmax = oldmax + NALLOC; 

if ((pfd = realloc(pfd, newmax * sizeof(struct pollfd))) -- NULL) 
err sys("realloc error"); 

for (i = oldmax; i < newmax; i++) { 


pfd[i].fd = -1; 
pfd[i].events = POLLIN; 
pfd[i].revents = 0; 
} 
*maxfd = newmax; 
return (pfd); 
) 


void 
loop(void) 
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int i, listenfd, clifd, nread; 

char buf [MAXLINE]; 

uid_t uid; 

struct pollfd *pollfd; 

int numfd - 1; 

int maxfd = NALLOC; 

if ((pollfd = malloc(NALLOC * sizeof(struct pollfd))) == NULL) 


err sys("malloc error"); 
for (i = 0; i < NALLOC; i++) { 
pollfd[i].fd = -1; 
pollfd[i].events = POLLIN; 
pollfd[i].revents = 0; 


/* obtain fd to listen for client requests on */ 
if ((listenfd = serv_listen(CS_OPEN)) < 0) 
log sys("serv listen error"); 
client add(listenfd, 0); /* we use [0] for listenfd */ 
pollfd[0].fd = listenfd; 


for (. 2 4 
if (poll(pollfd, numfd, -1) < 0) 
log sys("poll error"); 


if (pollfd[0].revents & POLLIN) ( 
/* accept new client request */ 
if ((clifd = serv accept(listenfd, &uid)) < 0) 
log sys("serv accept error: $d", clifd); 
client add(clifd, uid); 


/* possibly increase the size of the pollfd array */ 
if (numfd == maxfd) 
pollfd = grow pollfd(pollfd, &maxfd); 
pollfd[numfd].fd = clifd; 
pollfd[numfd].events = POLLIN; 
pollfd[numfd].revents - 0; 
numfd++; 
log_msg("new connection: uid %d, fd %d", uid, clifd); 


for (i = l1; i < numfd; i++) { 
if (pollfd[i].revents & POLLHUP) { 
goto hungup; 
} else if (pollfd[i].revents & POLLIN) { 
/* read argument buffer from client */ 
if ((nread = read(pollfd[i].fd, buf, MAXLINE)) < 0) { 
log sys("read error on fd $d", pollfd[i].fd); 
) else if (nread == 0) { 
hungup: 
/* the client closed the connection */ 
log msg("closed: uid $d, fd %d", 
client[i].uid, pollfd[i].fd); 
client del(pollfd[i]l.fd); 
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close(pollfd[i].fd); 

if (i < (numfd-1)) { 
/* pack the array */ 
pollfd[i].fd = pollfd[numfd-1] .fd; 
pollfd[i].events = pollfd[numfd-1].events; 
pollfd[i].revents = pollfd[numfd-1].revents; 
= /* recheck this entry */ 


} else { /* process client's request */ 
handle_request (buf, nread, pollfd[i].fd, 
client [i] .uid); 





图 17-30 ”使 用 poll 的 loop 函数 

为 使 打开 描述 符 的 数量 能 与 客户 进程 数量 相当 ， 我 们 动态 地 为 po11fd 结构 的 数字 分 配 空间 ， 
所 使 用 的 策略 与 client alloc 函数 分 配 client 数组 〈 见 图 17-27) 时 所 使 用 的 相同 。 

pollfd 数组 中 的 第 一 个 登记 项 (下 标号 为 0) 用 于 listenfd 描述 符 。 新 客户 进程 连接 的 
到 达 由 listenfd 描述 符 中 的 POLLIN 指示 。 如 同 前 述 ， 调 用 serv accept 来 接受 该 连接 。 

对 于 一 个 现 有 的 客户 进程 , 应 当 处 理 来 自 Pol1 的 两 个 不 同事 件 : 由 POLLHUP 指示 的 客户 进程 
终止 ， 由 POLLIN 指示 的 来 自 现 有 客户 进程 的 一 个 新 请 求 。 即 使 连接 的 服务 器 端 还 在 读 取 数据 ， 客 
户 端 也 能 够 关闭 它 这 端的 连接 。 即 使 连接 的 一 端 已 经 被 标记 为 挂 起 状态 ， 服 务 器 仍然 可 以 读 取 在 它 
那 端 队列 里 的 数据 。 当 然 ， 服 务 器 在 收 到 客户 端的 挂 起 消息 时 用 close 关闭 到 客户 端的 连接 ， 可 有 
效 地 抛弃 所 有 队列 里 的 数据 。 剩 下 的 请 求 也 没 必要 处 理 ， 因 为 我 们 已 经 无 法 发 回响 应 的 信息 。 

如 同 此 函数 的 select 版 本 ， 调 用 request 函数 〈 见 图 17-31) 处 理 来 自 客户 进程 的 新 请 求 。 
此 函数 类 似 于 其 早期 版 本 〈 见 图 17-22)。 它 调用 同一 函数 buf args (MLA 17-23), buf args 
又 调用 cli_args (WAR 17-24)， 但 是 ， 因 为 它 是 在 一 个 守护 进程 中 运行 的 ， 所 以 它 在 日 志文 件 
中 记录 出 错 消息 ， 而 不 是 在 标准 错误 上 打印 它们 。 


#include "opend.h" 
#include «fcntl.h» 
void 


handle request(char *buf, int nread, int clifd, uid t uid) 
{ 
int newfd; 


if (buf[nread-1] != 0) { 
snprintf(errmsg, MAXLINE-1, 
"request from uid %d not null terminated: %*.*s\n", 
uid, nread, nread, buf); 
send_err(clifd, -1, errmsg); 
return; 
) 
log msq("request: $s, from uid $d", buf, uid); 
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/* parse the arguments, set options */ 
if (buf_args(buf, cli_args) < 0) { 
send_err(clifd, -1, errmsg); 
log_msg (errmsg) ; 
return; 


} 


if ((newfd = open(pathname, oflag)) < 0) { 
snprintf (errmsg, MAXLINE-1, "can't open $s: %s\n", 
pathname, strerror(errno)); 
send_err(clifd, -1, errmsg); 
log_msg (errmsg) ; 
return; 


} 


/* send the descriptor */ 
if (send_fd(clifd, newfd) < 0) 
log_sys ("send fd error"); 
log msg("sent fd $d over fd $d for %s", newfd, clifd, pathname) ; 
close (newfd); /* we're done with descriptor */ 





17-34 request 函数 
这 就 完成 了 open 服务 器 进程 第 2 版 ， 它 仅 使 用 一 个 守护 进程 就 处 理 了 所 有 的 客户 进程 请 求 。 


17.7 小 结 


本 章 的 关键 点 是 如 何在 两 个 进程 之 间 传 送 文 件 描 述 符 ， 以 及 服务 器 进程 如 何 接受 来 自 客 户 进 
程 的 唯一 连接 。 虽 然 所 有 平台 都 支持 UNIX 域 套 接 字 〈 见 图 15-1)， 但 是 各 种 实现 都 有 不 同 之 处 ， 
这 使 我 们 很 难 开发 可 移植 的 应 用 程序 。 

整 章 都 使 用 了 UNIX 域 套 接 字 。 我 们 了 解 了 如 何 用 它们 来 实现 一 个 全 双 工 的 管道 以 及 如 何 利 
用 它们 来 适应 14.4 节 的 IO 多 路 转 接 函数 以 间接 地 用 于 XSI 消息 队列 中 。 

本 章 给 出 了 open 服务 器 进程 的 两 个 版 本 。 一 个 版 本 由 客户 进程 用 fork 和 exec 直接 调用 ， 
男 一 版 本 是 一 个 守护 服务 器 进程 处 理 所 有 客户 进程 请 求 。 这 两 个 版 本 均 采 用 文件 描述 符 传 送 和 接 
收 函 数 。 

我 们 还 展示 了 如 何 使 用 getopt 函数 来 保证 命令 行 参数 处 理 的 一 致 性 。 最 终 的 open 服务 器 
进程 版 本 使 用 了 getopt 函数 、17.3 节 中 引入 的 客户 进程 -服务 器 进程 连接 函数 和 14.4 节 中 的 IO 
多 路 转 接 函 数 。 


习题 


17.1 我 们 选择 使 用 图 17-3 中 的 UNIX 域 数 据 报 套 接 字 ， 因 为 它们 能 够 保留 消息 边界 。 描 述 如 果 
使 用 常规 的 管道 实现 需要 哪些 必要 的 改动 。 我 们 应 当 如 何 避 免 额 外 的 两 次 消息 复制 呢 ? 

17.2 使 用 本 章 描述 的 文件 描述 符 传送 函数 以 及 8.9 节 中 描述 的 父 进程 和 子 进程 同步 例 程 , 编写 具 
有 下 列 功能 的 程序 。 该 程序 调用 fork， 子 进程 打开 一 个 现 有 的 文件 并 将 打开 文件 描述 符 传 
送 给 父 进程 。 然 后 ， 子 进程 调用 lseek 确定 该 文件 的 当前 读 、 写 位 置 ， 通 知 父 进程 。 父 进 
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程 读 该 文件 的 当前 偏 移 量 ， 并 打印 它 以 便 验证 。 若 此 文件 按 上 述 方式 从 子 进程 传递 到 父 进 
程 ， 则 父 进程 和 子 进程 应 共享 同一 个 文件 表 项 ， 所 以 当 子 进程 每 次 更 改 该 文件 当前 偏 移 量 
时 ， 这 种 更 改 应 该 也 会 影响 父 进 程 的 描述 符 。 使 子 进程 将 该 文件 定位 至 一 个 不 同 偏 移 量 ， 
并 再 次 通知 父 进程 。 

图 17-20 和 图 17-21 中 的 程序 分 别 定义 和 声明 了 全 局 变量 ， 两 者 的 区 别 是 什么 ? 

改写 buf args 函数 〈 见 图 17-23)， 删 除 其 中 对 argv 数组 长 度 的 编译 时 限制 。 请 用 动态 
存储 分 配 。 

描述 优化 图 17-29 和 图 17-30 中 的 loop 函数 的 方法 ， 并 实现 之 。 

在 serv listen B CLA 17-8〉 中 ， 如 果 文 件 已 经 存在 ， 我 们 要 先 对 代表 UNIX RE 
接 字 的 文件 名 解除 链接 。 为 了 防止 误 删除 不 是 套 接 字 的 文件 , 我 们 可 以 先 调 用 stat 来 验证 
文件 类 型 。 解 释 这 种 做 法 存在 的 两 个 问题 。 

请 给 出 两 种 可 能 的 方法 ,使 得 单 次 调用 sendmsg 可 以 传递 多 个 文件 描述 符 。 尝 试 实现 你 的 
方法 并 验证 你 的 操作 系统 是 否 支 持 这 样 的 方法 。 670 
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18.1 引言 


无 论 在 哪 种 操作 系统 中 ， 终 端 VO 的 处 理 都 是 非常 繁琐 的 一 部 分 ，UNIX 系统 也 不 例外 。 在 
大 多 数 版 本 的 编程 手册 中 ， 终 端 IO 手册 页 常常 是 最 长 的 几 个 部 分 之 一 。 

在 20 世纪 70 年 代 后 期 , 系统 II 在 V7 的 基础 上 发 展 出 一 套 不 同 的 终端 例 程 , 由 此 使 得 UNIX 
终端 IO 处 理 分 立 为 两 种 不 同 的 风格 。 一 种 是 系统 工 的 风格 ， 由 System V 沿 续 下 来 ， 另 一 种 是 
V7 的 风格 ， 它 成 为 BSD 派生 的 系统 终端 VO 处 理 的 标准 。 如 同 信号 一 样 ，POSIX.1 在 这 两 种 风 
格 的 基础 上 制定 了 终端 UO 标准 。 本 章 将 介绍 POSIX.1 的 所 有 终端 函数 ， 以 及 某 些 平台 特有 的 增 
加 部 分 。 

终端 VO 系统 之 所 以 如 此 复杂 ， 部 分 原因 是 人 们 将 其 应 用 在 众多 的 事物 上 : 终端 、 计 算 机 之 
间 的 直接 连接 、 调 制 解 调 器 以 及 打印 机 等 。 


18.2 综述 


终端 VO 有 两 种 不 同 的 工作 模式 。 
(1) 规范 模式 输入 处 理 。 在 这 种 模式 中 ， 对 终端 输入 以 行为 单位 进行 处 理 。 对 于 每 个 读 请 求 ， 
终端 驱动 程序 最 多 返回 一 行 。 
671 (2) 非 规范 模式 输入 处 理 。 输 入 字符 不 装配 成 行 。 
如 果 不 做 特殊 处 理 ， 则 默认 模式 是 规范 模式 。 例 如 ， 若 shell 将 标准 输入 重 定向 到 终端 ， 并 用 
read 和 write 将 标准 输入 复制 到 标准 输出 ， 则 终端 以 规范 模式 进行 工作 ， 每 次 read 最 多 返回 
- 行 。 处 理 整 个 屏幕 的 程序 (如 vi 编辑 器 ) 使 用 非 规范 模式 ， 原 因 是 它 的 命令 可 能 是 由 单个 字 
符 组 成 的 ， 并 且 不 以 换行 符 终止 。 另 外 ， 该 编辑 器 并 不 希望 系统 对 特殊 字符 进行 处 理 ， 因 为 这 些 
字符 很 可 能 与 编辑 命令 中 使 用 的 字符 重 玛 。 例 如 ，Ctrl+D 字符 通常 是 终端 的 文件 结束 符 , 但 在 vi 
中 它 是 向 下 滚动 半 个 屏幕 的 命令 。 
V7 和 较 早 的 BSD 风格 类 的 终端 驱动 程序 支持 3 种 终端 输入 模式 : (a) 精细 加 工 模式 ( 输入 
装配 成 行 ， 并 对 特殊 字符 进行 处 理 ); (b) 原始 模式 (输入 不 装配 成 行 ， 也 不 对 特殊 字符 进行 处 理 ); 
(c) cbreak 模式 ( 输入 不 装配 成 行 ， 但 对 菜 些 特殊 字符 进行 处 理 )。 图 18-20 显示 了 将 终端 设置 为 
cbreak 或 原始 模式 的 POSIX.1 函数 。 


POSIX.1 定义 了 11 个 特殊 输入 字符 ， 其 中 9 个 可 以 更 改 。 本 书 已 经 用 到 了 其 中 几 个 ， 例 





如 文件 结束 符 (通常 是 Ctrl+D) 和 挂 起 字符 (通常 是 Ctrl+Z)。18.3 节 将 对 这 些 字 符 逐 一 进行 


说 明 。 


可 以 认为 终端 设备 是 由 通常 位 于 内 核 中 的 终端 驱动 程序 控制 的 。 每 个 终端 设备 都 有 一 个 输入 


队列 和 一 个 输出 队列 ， 如 图 18-1 所 示 。 
进程 写 的 下 一 个 字符 
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进程 读 的 下 一 个 字符 


| 








3 a We 
| 输出 队列 | JAMES 输入 队列 
em poe | 





传送 到 设备 的 从 设备 中 读 取 的 
下 一 个 字符 


下 一 个 字符 


图 18-1 终端 设备 的 输入 、 输 出 队列 的 逻辑 结构 


对 此 图 要 说 明 以 下 几 点 。 


。 如 果 打 开 了 回 显 功能 ， 则 在 输入 队列 和 输出 队列 之 间 有 一 个 隐 含 的 连接 。 


。 输入 队列 的 长 度 MAX_INPUT( 见 图 2-11) 是 有 限 值 。 当 一 个 特定 设备 的 输入 队列 已 经 填 


满 时 ， 系 统 的 行为 将 依赖 于 实现 。 这 种 情况 发 生 时 大 多 数 UNIX 系统 回 显 响 铃 字符 。 


。 图 中 没有 显示 另 一 个 输入 限制 MAX_CANON。 这 个 限制 是 一 个 规范 输入 行 的 最 大 字 


TÉ. 


。 虽然 输出 队列 的 长 度 通常 也 是 有 限 的， 但 是 程序 并 不 能 获得 这 个 定义 其 长 度 的 常量 ， 


为 当 输出 队列 将 要 填 满 时 ， 内 核 便 直 接 使 写 进程 休眠 ， 直 至 写 队 列 中 有 可 用 的 空间 。 


。 我 们 将 说 明 如 何 使 用 冲洗 函数 tcflush 冲洗 输入 或 输 
出 队列 。 与 此 类 似 ， 在 说 明 tcsetattr MAN, HS 
了 解 到 如 何 通 知 系统 只 有 在 输出 队列 为 空 时 ， 才 能 改变 
一 个 终端 的 属性 。( 例 如 ， 想 要 改变 输出 属性 时 就 要 这 样 
做 。) 也 可 以 通知 系统 ， 让 它 在 改变 终端 属性 时 丢弃 输入 
队列 中 的 所 有 东西 。( 如 果 正 在 改变 输入 属性 , 或 者 在 规 
范 模 式 和 非 规范 模式 之 间 进 行 转换 ， 就 需要 这 样 做 ， 以 
免 以 错误 的 模式 对 以 前 输入 的 字符 进行 解释 。) 

大 多 数 UNIX 系统 在 一 个 称 为 终端 行规 程 (terminal line 
discipline) 的 模块 中 进行 全 部 的 规范 处 理 。 可 以 将 这 个 模块 设想 
成 一 个 盒子 ， 位 于 内 核 通用 读 、 写 函数 和 实际 设备 驱动 程序 之 间 
( 见 图 18-2). 

由 于 将 规范 处 理 分 离 为 单独 的 模块 ， 所 有 的 终端 驱动 程序 
都 能 够 一 致 地 支持 规范 处 理 。 在 第 19 章 讨论 伪 终 端 时 还 将 使 用 
此 图 。 

所 有 可 以 检测 和 更 改 的 终端 设备 特性 都 包含 在 termios 结 
构 中 。 该 结构 定义 在 头 文件 <termios .h> 中 ， 本 章 使 用 这 一 头 
文件 。 


用 户 进程 








终端 行规 程 





实际 设备 
图 18-2 终端 行规 程 





因 
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struct termios { 


teflag.t c iflag; /* input flags */ 
tcflag t c oflag; /* output flags */ 
tcflag t c cflag; /* control flags */ 
tcflag t c lflag; /* local flags */ 

ect C CcC[NCCS]; /* control characters */ 


}; 

粗略 地 说 ， 输 入 标志 通过 终端 设备 驱动 程序 控制 字符 的 输入 《〈 例 如， 和 剥 除 输 入 字 节 的 第 8 位 ， 
允许 输入 奇偶 校 验 )， 输 出 标志 则 控制 驱动 程序 输出 〈 例 如， 执行 输出 处 理 、 将 换行 符 转换 为 
CR/LF)， 控 制 标志 影 响 RS-232 串 行 线 〈 例 如 ， 忽 略 调制 解 调 器 的 状态 线 、 每 个 字符 的 一 个 或 两 
个 停止 位 )， 本 地 标志 影响 驱动 程序 和 用 户 之 间 的 接口 (例如 ， 回 显 打开 或 关闭 、 可 视 地 擦 除 字 
符 、 允 许 终端 产生 的 信号 以 及 对 后 台 输 出 的 作业 控制 停止 信号 )。 

类 型 tcflag 的 长 度 足以 保存 每 个 标志 值 ， 它 经 常 被 定义 为 unsigned int 或 者 unsigned 
long. c_cc 数组 包含 了 所 有 可 以 更 改 的 特殊 字符 。NCCS 是 该 数组 中 元 素 的 数量 , 其 典型 值 在 15 一 
20 〔 因 为 大 多 数 UNIX. 实现 支持 的 特殊 字符 都 比 POSIX.1 所 定义 的 11 个 要 多 )。cc_t 类 型 的 长 
度 足 以 保存 每 个 特殊 字符 ， 典 型 的 是 unsigned char. 


POSIX 标准 之 前 的 System V 版 本 有 一 个 名 为 <termio.h> 的 头 文件 和 一 个 名 为 termio 的 数 
据 结 构 。 为 了 与 先前 版 本 有 所 区 别 ，POSIX.1 在 这 些 名 字 后 加 了 一 个 s。 


图 18-3 至 图 18-6 列 出 了 所 有 可 以 更 改 以 影响 终端 设备 特性 的 终端 标志 。 注 意 ， 虽 然 Single 
UNIX Specification 定义 了 供 所 有 平台 启动 所 用 的 公共 子 集 ， 但 所 有 实现 都 有 自己 的 扩充 部 分 。 这 
些 扩充 部 分 大 多 来 自 各 系统 之 间 的 历史 差异 。18.5 节 将 对 这 些 标志 值 进行 详细 的 讨论 。 


= ; FreeBSD Linux Mac OS X Solaris 
+ 
ioe aa 320 10.6.8 10 


CBAUDEXT 扩充 的 波 特 率 

CCAR OFLOW | 输出 的 DCD 流 控制 
CCTS_OFLOW | 输出 的 CTS 流 控 制 
CDSR_OFLOW | 输出 的 DSR 流 控制 




























































CDTR_IFLOW | 输入 的 DTR 流 控 制 
CIBAUDEXT | 扩充 输入 波 特 率 
CIGNORE 忽略 控制 标志 

CLOCAL 忽略 调制 解 调 器 状态 行 
CMSPRR 标记 或 空 奇 偶 性 
CREAD 启用 接收 装置 
CRTSCTS 启用 硬件 流 控制 
CRTS IFLOW | 输入 的 RTS 流 控制 
CRTSXOFF 启用 输入 硬件 流 控制 
CSIZE 字符 大 小 屏蔽 字 
CSTOPB 发 送 两 个 停止 位 , 否则 发 送 1 位 
HUPCL 最 后 关闭 时 挂 断 
MDMBUF 与 CCAR_OFLOW 相同 
PARENB 启用 奇偶 校 验 

PAREXT 标记 或 空 奇偶 性 






PARODD 奇 校 验 ， 否 则 为 偶 校 验 


图 18-3 c cflag 终端 标志 


BRKINT 
ICRNL 
IGNBRK 
IGNCR 
IGNPAR 
IMAXBEL 
INLCR 
INPCK 
ISTRIP 
IUCLC 
IUTF8 
IXANY 
IXOFF 
IXON 
PARMRK 


ALTWERASE 
ECHO 
ECHOCTL 
ECHOE 
ECHOK 
ECHOKE 
ECHONL 
ECHOPRT 


EXTPROC 
FLUSHO 
ICANON 
IEXTEN 
ISIG 

NOFLSH 
NOKERNINFO | 无 来 自 STATUS 的 内 核 输出 


PENDIN 
TOSTOP 
XCASE 


FreeBSD Linux Mac OS X 
POST 8.0 3.2.0 10.6.8 


接 到 BREAK 时 产生 SIGINT 
将 输入 的 CR 转换 为 NL 
忽略 BREAK 条 件 

忽略 CR 

忽略 奇偶 校 验 出 错 的 字符 

在 输入 队列 满 时 振 铃 

将 输入 的 NL 转换 为 CR 
打开 输入 奇偶 校 验 

剥 除 输入 字符 的 第 8 位 

将 输入 的 大 写字 符 转换 成 小 写字 符 
输入 是 UTF-8 

使 任何 字符 都 重新 启动 输出 
使 启用 /禁用 输入 流 控制 起 作用 
使 启用 /禁用 输出 流 控制 起 作用 
标记 奇偶 检验 错误 





K 18-4 c_iflag 终端 标志 
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Solaris 
10 


FreeBSD Linux Mac OS X Solaris 
POSIX.1 8.0 3.2.0 10.6.8 10 


使 用 替换 WERASE 算法 
启用 回 显 

回 显 控制 字符 为 ^ (CChar) 
可 视 地 探 除 字符 
回 显 杀 死 符 

杀 死 的 可 见 擦 除 
回 显 NL 

硬 拷贝 的 可 见 擦 除 方式 
外 部 字符 处 理 

冲洗 输出 

规范 输入 

使 扩充 的 输入 字符 处 理 起 作用 
使 终端 产生 的 信号 起 作用 
在 中 断 或 退出 后 不 冲洗 


重新 键入 未 决 输入 
对 于 后 台 输 出 发 送 SIGTTOU 
规范 的 大 /小 写 表 示 


图 18-5 c_lflag 终端 标志 





给 出 了 所 有 可 用 的 选项 后 ， 如 何 才 能 检测 和 更 改 终端 设备 的 这 些 特 性 呢 ? 图 18-7 总 结 并 
列 出 了 Single UNIX Specification 所 定义 的 对 终端 设备 进行 操作 的 各 个 函数 。( 列 出 的 所 有 函 
数 都 是 POSIX 基本 规范 的 组 成 部 分 。9.7 节 已 说 明了 tcgetpgrp. tcgetsid 和 tcsetpgrp 


函数 。) 


注意 ， 对 终端 设备 ，Single UNIX Specification 没有 使 用 经 典 的 ioct1， 而 是 使 用 了 图 18-7 
中 列 出 的 13 个 函数 。 这 样 做 的 理由 是 : 对 于 终端 设备 的 ioct1l 函数 ， 其 最 后 一 个 参数 的 数据 类 
型 随 执 行动 作 的 不 同 而 改变 。 因 此 ， 不 可 能 对 参数 进行 类 型 检查 。 
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FreeBSD Linux Mac OS X Solaris 
POSSE 8.0 32.0 10.6.8 10 


一 一 一 一 


BSDLY | 退 格 延 迟 屏蔽 字 

CRDLY | CR 延迟 屏蔽 字 

FFDLY | 换 页 延迟 屏蔽 字 

NLDLY | NL 延迟 屏蔽 字 

OCRNL | 将 输出 的 CR 映射 为 NL 
OFDEL | RA DEL, EWA NUL 
OFILL | 延迟 使 用 填充 符 





OLCUC | 将 输出 的 小 写字 符 映 射 为 大 写字 符 
ONLCR | 将 NL 映射 为 CR-NL 

ONLRET | NL 执行 CR 功能 

ONOCR | 在 0 列 不 输出 CR 

ONOEOT | 在 输出 中 丢弃 EOT 字符 (AD) 
OPOST | 执行 输出 处 理 

OXTABS | 将 制 表 符 扩充 为 空格 

TABDLY | KFAR EER RF 

VTDLY | 垂直 制 表 符 延 迟 屏蔽 字 





图 18-6 c oflag 终端 标志 
















获取 属性 (termios 结构 ) 
设置 属性 (termios 结构 ) 
获得 输入 速度 
获得 输出 速度 
设置 输入 速度 
设置 输出 速度 
等 待 所 有 输出 都 被 传输 
挂 起 传输 或 接收 
冲洗 未 决 输入 和 /或 输出 
发 送 BREAK 字符 
获得 前 台 进 程 组 ID 
设置 前 台 进 程 组 ID 
得 到 控制 TTY 的 会 话 首 进程 的 进程 组 ID 
图 18-7 终端 1/0 函数 汇总 
虽然 在 终端 设备 上 进行 操作 的 只 有 13 个 函数 ,但 是 图 18-7 中 的 前 两 个 函数 (tcgetattr 
和 tcsetattr) 能 处 理 大 约 70 种 不 同 的 标志 ( 见 图 18-3 至 图 18-6)。 终 端 设备 有 大 量 选 
项 可 供 使 用 ， 此 外 ， 对 于 某 个 特定 设备 (假设 其 为 终端 ” 调制解调器 、 打 印 机 或 任何 其 他 
设备 )， 决 定 其 需要 哪些 选项 对 我 们 来 说 也 是 一 种 挑战 ， 这 些 都 使 得 对 终端 设备 的 处 理 变 
得 异常 复杂 。 
图 18-7 中 列 出 的 13 个 函数 之 间 的 关系 如 图 18-8 所 示 。 
POSIX.1 没有 指定 将 波 特 率 信息 存储 在 termios 结构 中 的 什么 地 方 ， 它 依赖 于 实现 的 细节 。 
某 些 系统 ， 如 Solaris, 将 此 信息 存储 在 c_cflag 字段 中 。Linux 和 BSD 派生 的 系统 ,如 FreeBSD 
| $» Mac OS X， 则 在 此 结构 中 有 两 个 分 开 的 字段 : 一 个 存储 输入 速度 ， 另 一 个 存储 输出 速度 。 





tcgetattr 





tcsetattr 







cfgetispeed 





cfgetospeed 






cfsetispeed 
cfsetospeed 
tcdrain 
tcflow 
tcflush 
tcsendbreak 
tcgetpgrp 
tcsetpgrp 














tcgetsid 





cfsetispeed 
cfgetispeed 


cfsetospeed 
cfgetospeed 
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Struct 
termios x 
行 控制 函数 前 台 进 程 组 ID 
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D 

终端 行规 程 / 终端 设备 驱动 程序 








图 18-8 与 终端 有 关 的 各 函数 之 间 的 关系 


18.3 ”特殊 输入 字符 


POSIX.1 定义 了 11 个 在 输入 时 要 特殊 处 理 的 字符 。 实 现 定义 了 男 外 一 些 特殊 字符 。 


总 结 并 列 出 了 这 些 特殊 字符 。 


(不 能 更 改 ) 

VDISCARD 
k VDSUSP 
(SIGTSTP) 
文件 结束 VEOF 
行 结束 VEOL 
供 替换 的 行 结束 |VEOL2 
向 前 擦 除 字符 ” |VERASE 
供 蔡 换 的 向 前 擦 [VERASE2 
除 字符 
中 断 信 号 
(SIGINT) 
HIT VKILL 

一 个 字符 的 字 |VLNEXT 

面值 
换行 
退出 信号 
(SIGQUIT) 
再 打印 全 部 输入 
恢复 输出 


VINTR 


(不 能 更 改 ) 
VQUIT 


VREPRINT 
VSTART 
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320 X 10.6.8 


(SIGTSTP) 
WERASE | 向 前 擦 除 一 个 字 | VWERASE 





图 18-9 终端 特殊 输入 字符 汇总 〈 续 ) 

在 POSIX.1 的 11 个 特殊 字符 中 ， 其 中 有 9 个 字符 的 值 可 以 任意 更 改 。 不 能 更 改 的 两 个 特殊 
字符 是 换行 符 和 回 车 符 (分 别 是 \n 和 \r)， 也 可 能 是 STOP 和 START 字符 (依赖 于 实现 )。 为 了 
更 改 ， 只 需要 修改 termios 结构 中 c cc 数组 的 相应 项 。 该 数组 中 的 元 素 都 用 名 字 作 为 下 标 进 
行 引 用 ， 每 个 名 字 都 以 字母 V 开 头 〈 见 图 18-9 中 的 第 3 列 )。 

POSIX.1 允许 禁止 使 用 这 些 字符 。 若 将 c cc 数组 中 的 某 项 设置 为 POSIX VDISABLE 的 值 ， 
则 禁止 使 用 相应 特殊 字符 。 


在 Single UNIX Specification 的 早期 版 本 中 ， 支 持 POSIX VDISABLE 是 可 选项 ， 现 在 则 是 必 选 项 。 
本 书 讨论 的 4 种 平台 都 支持 此 特性 。Linux 32.0 和 Solaris 10 将 _POSIX_VDISRABLE 定义 为 0， 而 
FreeBSD 8.0 和 Mac OS X 10.6.8 则 将 其 定义 为 0xff。 
某 些 早期 的 UNIX 系统 所 用 的 方法 是 : 若 与 菜 一 特性 相应 的 特殊 输入 字符 是 0， 则 禁止 使 用 该 特性 。 
加 实例 
在 详细 说 明 各 特殊 字符 之 前 ， 先 看 一 个 更 改 特殊 字符 的 小 程序 。 图 18-10 所 示 的 程序 禁用 中 
断 字符 ， 并 将 文件 结束 符 设 置 为 Ctrl+B。 


#include "apue.h" 
#include <termios.h> 


int 


main(void) 


{ 


struct termios term; 
long vdisable; 
if (isatty(STDIN_FILENO) == 0) 


err_quit ("standard input is not a terminal device"); 


if ((vdisable = fpathconf(STDIN FILENO, _PC_VDISABLE)) < 0) 
err quit("fpathconf error or POSIX VDISABLE not in effect"); 


if (tcgetattr(STDIN FILENO, &term) < 0) /* fetch tty state */ 
err sys("tcgetattr error"); 


term.c cc[VINTR] = vdisable; /* disable INTR character */ 
term.c cc[VEOF] = 2; /* EOF is Control-B */ 


if (tcsetattr(STDIN FILENO, TCSAFLUSH, &term) < 0) 
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err_sys("tcsetattr error"); 


exit(0); 
| IMER—————————————Á 
18-10 ”禁用 中 断 字符 并 更 改 文件 结束 符 
对 此 程序 要 说 明 以 下 几 点 。 


。 仅 当 标 准 输入 是 终端 设备 时 才 修 改 终端 特殊 字符 。 调 用 isatty CA 18.9 节 ) 对 此 进行 检测 。 
e 用 fpathconf 获取 POSIX VDISABLE 值 。 
e 函数 tcgetattr ( 见 18.4 节 ) 从 内 核 获取 termios 结构 。 在 修改 了 此 结构 后 ， 调 
用 tcsetattr 函数 设置 属性 ， 只 有 我 们 所 希望 修改 的 属性 被 更 改 了 ， 而 其 他 属性 保 
持 不 变 。 
。 禁用 中 断 键 与 忽略 中 断 信 号 是 不 同 的 。 图 18-10 中 的 程序 所 做 的 只 是 禁用 使 终端 驱动 程序 
产生 SIGINT 信和 号 的 特殊 字符 。 我 们 仍 可 使 用 kill 函数 将 该 信号 发 送 至 进程 。 a 
下 面 较 详细 地 说 明 各 个 特殊 字符 。 我 们 称 这 些 字符 为 特殊 输入 字符 ， 但 是 其 中 有 两 个 字 
符 一 一 STOP 和 START (Ctrl+S 和 Ctrl+Q)， 在 输出 时 也 要 进行 特殊 处 理 。 注 意 ， 这 些 字 符 中 的 大 
多 数 在 被 终端 驱动 程序 识别 并 进行 特殊 处 理 后 会 被 丢弃 ， 并 不 将 它们 返回 给 执行 读 终 端 操作 的 进 
程 。 返 回 给 读 进 程 的 例外 字符 是 换行 符 CNL. EOL. EOL2) 和 回 车 符 (CR)。 


CR 


DISCARD 


DSUSP 


EOF 


EOL 


EOL2 
ERASE 


回 车 符 。 不 能 更 改 此 字符 。 以 规范 模式 进行 输入 时 识别 此 字符 。 在 已 设置 ICANON 
(规范 模式 ) 和 ICRNL (将 CR 映射 为 NL) 但 并 未 设置 IGNCR (忽略 CR) Hf, CR 
字符 会 被 转换 成 NL， 并 具有 与 NL 字符 相同 的 作用 。 此 字符 返回 给 读 进程 (很 可 
能 是 在 转换 为 NL 之 后 )。 

丢弃 符 。 在 扩充 模式 (IEXTEN) 下 进行 输入 时 识别 此 字符 。 在 输入 另 一 个 DISCARD 
字符 之 前 或 在 丢弃 条 件 被 清除 之 前 ( 见 FLUSHO 选项 )， 此 字符 使 后 续 输 出 都 被 丢 
弃 。 此 字符 在 处 理 后 即 被 丢弃 〈 即 不 传送 给 读 进 程 )。 

延迟 挂 起 作业 控制 字符 Cdelayed-suspend job-control character). 。 在 扩充 模式 
(IEXTEN) 下 ， 若 支持 作业 控制 ,并且 已 设置 TSIG 标志 ， 则 在 输入 时 识别 此 字符 。 
与 SUSP 字符 的 相同 之 处 是 : 延迟 挂 起 字符 产生 SIGTSTP 信和 号， 该 信号 被 发 送 至 
前 台 进 程 组 中 的 所 有 进程 ( 见 图 9-7)。 但 是 ， 信 和 号 产生 的 时 间 并 不 是 在 键入 延迟 挂 
起 字符 之 时 ， 而 是 在 某 个 进程 从 控制 终端 读 到 此 字符 时 才 产 生 。 此 字符 在 处 理 后 即 
被 丢弃 〈 即 不 传送 给 读 进程 )。 

文件 结束 符 。 以 规范 模式 CICANON) 进行 输入 时 识别 此 字符 。 当 键入 此 字符 时 ， 
等 待 被 读 的 所 有 字 节 都 被 立即 传送 给 读 进程 。 如 果 没 有 字 节 等 待 读 ， 则 返回 0。 在 
行 首 输入 一 个 EOF 字符 是 向 程序 指示 文件 结束 的 正常 方式 。 此 字符 在 规范 模式 下 
处 理 后 即 被 丢弃 〈 即 不 传送 给 读 进程 )。 

附加 的 行 定 界 符 ， 与 NL 作用 相同 。 以 规范 模式 CICANON) 进行 输入 时 识别 此 字 
符 ， 并 将 此 字符 返回 给 读 进 程 。 但 是 此 字符 不 常用 。 

另 一 个 行 定 界 符 ， 与 NL 作用 相同 。 对 此 字符 的 处 理 方式 与 EOL 字符 相同 。 

向 前 探 除 字符 〈 退 格 )。 以 规范 模式 CICANON) 输入 时 识别 此 字符 。 它 擦 除 行 中 的 
前 一 个 字符 ,但 不 会 超越 行 首 字符 擦 除 上 一 行 中 的 字符 。 此 字符 在 规范 模式 下 处 理 
后 即 被 丢弃 〈 即 不 传送 给 读 进 程 )。 
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ERASE2 


INTR 


KILL 


LNEXT 


NL 


QUIT 


REPRINT 


START 


STATUS 


STOP 


SUSP 





供 蔡 换 的 向 前 擦 除 字符 ( 退 格 )。 对 此 字符 的 处 理 与 向 前 擦 除 字符 ERASE) 完全 相同 。 
中 断 字 符 。 若 已 设置 TSIG 标志 ， 则 在 输入 中 识别 此 字符 。 它 产生 SIGINT 信和 号， 

该 信号 被 送 至 前 台 进 程 组 中 的 所 有 进程 ( 见 图 9-7)。 此 字符 在 处 理 后 即 被 丢弃 ( 即 
不 传送 给 读 进程 )。 

杀 死 字符 。( 名 字 “ 杀 死 ” 在 这 里 又 一 次 被 误 用 ，kil1l 函数 是 用 来 将 某 一 信号 发 
送 给 进程 的 ， 而 此 字符 应 被 称 为 行 擦 除 符 ， 它 与 信号 毫 无 关系 。) 以 规范 模式 
CICANON) 输入 时 识别 此 字符 。 它 擦 除 一 整 行 ， 并 在 处 理 后 即 被 丢弃 〈 即 不 传送 
给 读 进程 )。 

下 一 个 字符 的 字面 值 (literal-next character)。 以 扩充 方式 (IEXTEN) 输入 时 识别 
此 字符 ， 它 使 下 一 个 字符 的 任何 特殊 含意 都 被 忽略 。 这 对 本 节 提 及 的 所 有 特殊 字符 
都 起 作用 。 使 用 这 一 字符 可 向 程序 键入 任何 字符 。LNEXT 字符 在 处 理 后 即 被 丢弃 ， 
但 输入 的 下 一 个 字符 被 传送 给 读 进程 。 

换行 字符 ， 也 被 称 为 行 定 界 符 。 不 能 更 改 此 字符 。 以 规范 模式 (ICANON) 输入 时 
识别 此 字符 。 此 字符 返回 给 读 进程 。 

退出 字符 。 若 已 设置 TSIG 标志 ， 则 在 输入 中 识别 此 字符 。 它 产生 SIGQUIT 信和 号 ， 

该 信号 又 被 送 至 前 台 进 程 组 中 的 所 有 进程 〈 见 图 9-7)。 此 字符 在 处 理 后 即 被 丢弃 
( 即 不 传送 给 读 进程 )。 

回忆 图 10-1, INTR 和 QUIT 的 区 别 是 : QUIT 字符 不 仅 按 默认 规则 终止 进程 ， 而 且 
还 产生 一 个 core 文件 。 

再 打印 字符 。 以 扩充 规范 模式 〈 设 置 了 IEXTEN 和 ICANON 标志 ) 进行 输入 时 识别 此 
字符 。 它 使 所 有 未 读 的 输入 被 输出 《再 回 显 )。 此 字符 在 处 理 后 即 被 丢弃 〈 即 不 传 
送 给 读 进程 )。 

启动 字符 。 若 已 设置 IXON 标志 ， 则 在 输入 中 识别 此 字符 。 若 已 设置 IXOFF 标志 ， 
则 自动 产生 此 字符 作为 输出 。 已 设置 IxON 时 ， 接 收 到 的 START 字符 使 停止 的 输 
出 (由 以 前 输入 的 STOP 字符 造成 ) 重新 启动 。 在 此 情形 下 ， 此 字符 在 处 理 后 即 被 
丢弃 〈 即 不 传送 给 读 进程 )。 

已 设置 IXOFF 标志 时 ， 若 新 的 输入 不 会 使 输入 缓冲 区 溢出 ， 则 终端 驱动 程序 自动 
产生 一 个 START 字符 来 恢复 以 前 被 停止 的 输入 。 

BSD 的 状态 请 求 字 符 。 以 扩充 规范 模式 (设置 了 IEXTEN 和 ICANON 标志 ) 进行 输入 
时 识别 此 字符 。 它 产生 SIGINGO 信号 ， 该 信号 又 被 送 至 前 台 进程 组 中 的 所 有 进程 
CILE] 9-7)。 另 外 ， 如 果 没 有 设置 NOKERNINFO 标志 ,， 则 有 关 前 台 进程 组 的 状态 信 
息 也 显示 在 终端 上 。 此 字符 在 处 理 后 即 被 丢弃 〈 即 不 传送 给 读 进 程 )。 

停止 字符 。 若 已 设置 TIXON 标志 ， 则 在 输入 中 识别 此 字符 。 若 已 设置 IXOFF 标志 ， 
则 自动 产生 此 字符 作为 输出 。 已 设置 IXON 时 ， 接 收 到 STOP 字符 则 停止 输出 。 在 
此 情形 下 ， 此 字符 在 处 理 后 即 被 丢弃 〈 即 不 传送 给 读 进程 )。 当 输入 一 个 START F 
符 后 ， 被 停止 的 输出 重新 启动 。 

已 设置 IXOFE 时 ， 终 端 驱动 程序 自动 产生 一 个 STOP 字符 以 防止 输入 缓冲 区 溢出 。 

挂 起 作业 控制 字符 。 若 支持 作业 控制 并 且 已 设置 TSIG 标志 ， 则 在 输入 中 识别 此 字 
符 。 它 产生 SIGTSTP 信号 ， 该 信号 又 被 送 至 前 台 进 程 组 的 所 有 进程 ( 见 图 9-7)。 此 
字符 在 处 理 后 即 被 丢弃 〈 即 不 传送 给 读 进程 )。 
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WERASE ” 字 探 除 字 符 。 以 扩充 规范 模式 (设置 了 IEXTEN 和 ICANON 标志 ) 进行 输入 时 识别 
此 字符 。 它 使 前 一 个 字 被 擦 除 。 首 先 ， 它 向 前 跳 过 任意 一 个 空白 字符 (空格 或 制 表 
符 )， 然 后 再 向 前 跃 过 前 一 记号 ， 使 光标 处 在 前 一 个 记号 的 第 一 个 字符 位 置 上 。 通 
常 ， 前 一 个 记号 在 磁 到 一 个 空白 字符 时 即 终止 。 但 是 ， 可 通过 设置 ALTWERASE bk 
志 来 改变 这 个 行为 。 此 标志 使 前 一 个 记号 在 碰 到 第 一 个 非 字母 、 非 数字 字符 时 即 终 
止 。 此 字符 在 处 理 后 即 被 丢弃 〈 即 不 传送 给 读 进 程 )。 
需要 为 终端 设备 定义 的 另 一 个 “字符 ”是 BREAK 字符 。BREAK 实际 上 并 不 是 一 个 字符 ， 
而 是 在 异步 串 行 数 据 传送 时 发 生 的 一 个 条 件 。 根 据 串 行 接口 的 不 同 ， 可 以 有 多 种 方式 通知 设备 驱 
动 程序 发 生 了 BREAK 条 件 。 
大 多 数 早 期 的 串 行 终端 都 有 一 个 标记 为 BREAK 的 键 ， 用 其 可 以 产生 BREAK 条 件 ， 这 就 是 
为 什么 大 多 数 人 认为 BREAK 就 是 一 个 字符 的 原因 。 某 些 较 新 的 终端 键盘 没有 BREAK 键 在 PC 
上 ，BREAK 键 可 能 有 其 他 用 途 。 例 如 ， 键 入 CtrlIHBREAK 可 中 断 Windows 命令 解释 器 。 


对 于 异步 串 行 数据 传送 ，BREAK 是 一 个 0 值 的 位 序列 ， 其 持续 时 间 长 于 要 求 发 送 一 个 字 节 的 时 间 。 
整个 0 值 位 序列 被 视 为 是 一 个 BREAK。18.8 节 将 说 明 如 何 用 tcsendbreak 函数 发 送 一 个 BREAK。 


18.4 ”获得 和 设置 终端 属性 


为 了 获得 和 设置 termios 结构 ， 可 以 调用 tcgetattr 和 tcsetattr 函数 。 这 样 就 可 以 
检测 和 修改 各 种 终端 选项 标志 和 特殊 字符 ， 使 终端 按 我 们 所 希望 的 方式 进行 操作 。 
#include <termios.h> 


int tcgetattr(int fd, struct termios *fermptr); 


int tcsetattr(int fd, int opt, const struct termios *fermptr); 


两 个 函数 的 返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 





这 两 个 函数 都 有 一 个 指向 termios 结构 的 指针 作为 其 参数 ， 它 们 或 者 返回 当前 终端 的 属性 ， 
或 者 设置 该 终端 的 属性 。 因 为 这 两 个 函数 只 对 终端 设备 进行 操作 , 所 以 若 应 没有 引用 终端 设备 则 
出 错 返 回 -1，errno 设置 为 ENOTTY。 

tcsetattr 的 参数 opt 使 我 们 可 以 指定 在 什么 时 候 新 的 终端 属性 才 起 作用 。opt 可 以 指定 为 
下 列 常量 中 的 一 个 。 

TCSANOW 更 改 立 即 发 生 。 

TCSADRAIN 发 送 了 所 有 输出 后 更 改 才 发 生 。 若 更 改 输 出 参数 则 应 使 用 此 选项 。 

TCSAFLUSH 发 送 了 所 有 输出 后 更 改 才 发 生 。 更 进一步 ， 在 更 改 发 生 时 未 读 的 所 有 输入 数 

据 都 被 丢弃 (冲洗 )。 

Tcsetattr 函数 的 返回 状态 在 使 用 时 易 产 生 混 淆 。 如 果 它 执行 了 任意 一 种 所 要 求 的 动作 ， 
即使 未 能 执行 所 有 要 求 的 动作 ， 它 也 返回 OK 表示 成 功 )。 如 果 该 函数 返回 OK， 则 我 们 有 责任 
检查 该 函数 是 否 执行 了 所 有 要 求 的 动作 。 这 就 意味 着 , 在 调用 tcsetattr 设置 所 希望 的 属性 后 ， 
需 调用 tcgetattr， 然 后 将 实际 终端 属性 与 所 希望 的 属性 相 比 较 ， 以 检测 两 者 是 否 有 区 别 。 

在 终端 第 一 次 被 打开 时 ， 其 属性 视 具体 情况 而 定 。 一 些 系 统 可 能 会 将 终端 属性 初始 化 为 具体 
实现 所 定义 的 值 ， 另 一 些 系 统 可 能 会 保留 并 使 用 最 后 一 次 使 用 终端 时 的 属性 值 。 通 过 打开 一 个 带 
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有 0_TTY_INIT 标志 〈 见 3.3 W) 的 驱动 设备 ， 可 以 确认 终端 的 行为 是 否 遵循 标准 ， 这 样 就 能 在 
调用 tcgetattr 时 ， 确 保 初 始 化 termios 结构 中 的 任何 非 标准 部 分 ， 使 得 在 修改 属性 和 调用 
tcgetattr 时 ， 终 端的 表现 符合 预期 。 


18.5 终端 选项 标志 


本 节 将 列 出 所 有 不 同 的 终端 选项 标志 ， 扩 展 图 18-3 至 图 18-6 中 的 说 明 。 我 们 将 按 字母 顺序 列 

出 各 个 选项 并 指出 每 个 选项 出 现在 4 个 终端 标志 字段 中 的 哪 一 个 。( 从 选项 名 字 中 看 不 出 它 所 处 的 
FEL.) 还 将 说 明 每 个 选项 是 否 是 Single UNIX Specification 定义 的 ， 并 列 出 了 支持 该 选项 的 平台 。 

列 出 的 所 有 选项 标志 〈 除 所 谓 的 屏蔽 字 标 志 外 ) 都 用 一 位 或 多 位 (设置 或 清除 ) KR. BRK 
字 标 志 定 义 多 个 位 ， 它 们 组 合 在 一 起 ， 可 以 定义 一 组 值 。 屏 项 字 标志 有 一 个 定义 名 ， 每 个 值 也 有 
一 个 名 字 。 例 如 ， 为 了 设置 字符 长 度 ， 首 先 用 字符 长 度 屏蔽 字 标志 CSIZE 将 表示 字符 长 度 的 位 
清 0， 然 后 设置 下 列 值 之 一 : CS5、CS6、CS7 或 cS8。 

由 Linux 和 Solaris 支持 的 6 个 延迟 值 也 有 屏蔽 字 标志 : BSDLY. CRDLY. FFDLY. NLDLY. 
TABDLY 和 VTDLY。 对 于 每 个 延迟 值 的 长 度 请 参阅 Solaris 中 的 termio (71) 手册 页 。 在 所 有 情况 
下 ， 延 迟 屏蔽 字 为 0 就 表示 没有 延迟 。 如 果 指 定 了 延迟 ， 则 由 OFILL 和 OFDEL 标志 决定 是 由 驱 
动 器 进行 实际 延迟 还 是 只 传输 填充 字符 。 


有 实例 
图 18-11 演示 了 如 何 使 用 这 些 屏蔽 字 标 志 取 一 个 值 或 者 设置 一 个 值 。 


#include "apue.h" 
#include <termios.h> 


int 
main (void) 
{ 


struct termios term; 


if (tcgetattr(STDIN FILENO, &term) < 0) 
err_sys("tcgetattr error"); 


switch (term.c_cflag & CSIZE) { 
case CS5: 
printf("5 bits/byte\n"); 
break; 
case CS6: 
printf("6 bits/byte\n" 
break; 
case CS7: 
printf("7 bits/byte\n" 
break; 
case CS8: 
printf ("8 bits/byte\n"); 
break; 
default: 
printf ("unknown bits/byte\n") ; 
} 


E 
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term.c_cflag &= ~CSIZE; /* zero out the bits */ 

term.c_cflag |= CS8; /* set 8 bits/byte */ 

if (tcsetattr(STDIN_FILENO, TCSANOW, &term) < 0) 
err_sys("tcsetattr error"); 


exit (0); 


图 18-11 tcgetattrflültcsetattr 实例 a 
下 面 说 明 各 选项 标志 。 

ALTWERASE (c_lflag, FreeBSD. MacOSX) 已 设置 此 标志 时 ， 若 输入 WERASE 字符 ， 
则 使 用 一 个 替换 的 字 擦 除 算法 。 它 不 是 向 前 移动 到 前 一 个 空白 字符 为 止 ， 而 是 
向 前 移动 到 第 一 个 非 字 母 、 非 数字 字符 为 止 。 

BRKINT (c_iflag, POSIX.1, FreeBSD, Linux, Mac OS X, Solaris) 若 已 设置 此 标志 ， 
而 未 设置 TIGNBRK， 则 在 接 到 BREAK 时 ， 冲 洗 输入 、 输 出 队列 ， 并 产生 一 个 
SIGINT 信和 号。 如果 此 终端 设备 是 一 个 控制 终端 ， 则 此 信和 号 就 是 为 前 台 进 程 组 
产生 的 。 
若 未 设置 IGNBRK 和 BRKINT， 但 是 设置 了 PARMRK， 则 BREAK 被 读 作 一 个 
3 字 节 序列 \377、\0 FINO; 车 也 未 设置 PARMRK， 则 BREAK 被 读 作 单 个 字 


符 \0。 
BSDLY (c_oflag, XSI, Linux, Solaris) 退 格 延 迟 屏 蔽 字 。 此 屏蔽 字 的 值 是 BS0 BK BS1. 
CBAUDEXT (c_cflag, Solaris) 扩充 的 波 特 率 。 用 于 允许 大 于 B38400 的 波 特 率 。( 将 在 
18.7 节 讨 论 波 特 率 。) 


CCAR OFLOW (c cflag, FreeBSD. Mac OS X) 使 用 RS-232 调制 解 调 器 DCD (Data-Carrier- 
Detect， 数 据 载 波 检测 > 信号 打开 输出 的 硬件 流 控制 。 这 与 早期 的 MDMBUF 标志 
相同 。 

CCTS OFLOW (c cflag, FreeBSD, Mac OS X. Solaris) 使 用 RS-232 CTS (Clear-To-Send, 
清除 发 送 ) 信号 打开 输出 的 硬件 流 控制 。 

CDSR OFLOW (c cflag, FreeBSD. Mac OS X) 根据 RS-232 DSR (Data-Set-Ready， 数 据 准 
备 就 绪 ) 信号 进行 输出 的 流 控制 。 

CDTR_IFLOW (c_cflag, FreeBSD, Mac OS X) 根据 RS-232 DTR (Data-Terminal-Ready， 
数据 终端 就 绪 ) 信号 进行 输入 的 流 控 制 。 

CIBAUDEXT (c_cflag, Solaris) 扩充 的 输入 波 特 率 。 用 于 允许 大 于 B38400 的 输入 波 特 率 。 


(将 在 18.7 节 讨 论 波 特 率 。) 
CIGNORE (c_cflag, FreeBSD, Mac OS X) 忽略 控制 标志 。 
CLOCAL (c_cflag, POSIX.1, FreeBSD, Linux, Mac OS X, Solaris) Zr Ei, WA 


略 调 制 解 调 器 状态 线 。 这 通常 意味 着 该 设备 是 直接 连接 的 。 例 如 ， 若 未 设置 
此 标志 ， 则 打开 一 个 终端 设备 常常 会 遭遇 阻塞 ， 直 到 调制 解 调 器 回应 呼叫 并 
建立 连接 。 

CMSPAR (c_oflag, Linux) 选择 标记 或 空 奇 偶 校 验 。 老 已 设置 PARODD， 则 奇偶 校 验 
位 总 是 1 (标记 奇偶 校 验 )。 否 则 奇偶 校 验 位 总 是 0〈 空 奇偶 校 验 )。 
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CRDLY 


CREAD 


CRTSCTS 


CRTS_IFLOW 
CRTSXOFF 


CSIZE 


CSTOPB 


ECHO 


ECHOCTL 


ECHOE 
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ECHOK 


(c_oflag, XSI. Linux, Solaris) 回 车 延迟 屏蔽 字 。 此 屏蔽 字 的 可 能 值 是 CRO. 
CR1、CR2 和 CR3。 

(c_cflag, POSIX.1、FreeBSD、Linux、Mac OS X. Solaris) 若 设 置 ， 则 接收 
者 被 启用 ， 可 以 接收 字符 。 

(c_cflag, FreeBSD. Linux, Mac OS X, Solaris) 其 行为 依赖 于 平台 。 对 于 
Solaris， 若 设置 该 标志 ， 则 允许 带 外 硬件 流 控制 。 在 另外 3 个 平台 上 ， 则 既 允 
许 带 内 硬件 流 控 制 ， 又 允许 带 外 硬件 流 控制 (等 价 于 CCTS_OFLOW |CRTS_ 
IFLOW). 

(c cflag, FreeBSD. Mac OS X, Solaris) 输入 的 RTS (Request-To-Send, ijj 
求 发 送 ) 流 控 制 。 

(c_cflag, Solaris) 若 设置 ， 则 允许 带 内 硬件 流 控制 ，RS-232 RTS 信号 的 状态 
控制 了 流 控 制 。 

(c_cflag, POSIX.1, FreeBSD. Linux, Mac OS X, Solaris) 此 字段 是 一 个 屏 
项 字 标 志 ， 它 指定 发 送 和 接收 的 每 个 字 节 的 位 数 。 此 长 度 不 包括 可 能 有 的 奇偶 
校 验 位 。 由 此 屏蔽 字 定 义 的 字段 值 是 Cs5. CS6, CS7 和 cs8， 分 别 表 示 每 个 
字 节 包含 5 位 、6 位 、7 位 和 8 位。 

(c_cflag, POSIX.1、FreeBSD、Linux、Mac OS X. Solaris) 若 设置 ， 则 使 用 
两 个 停止 位 ， 和 否则 只 使 用 一 个 停止 位 。 

(c_lflag, POSIX.1, FreeBSD, Linux, Mac OS X, Solaris) 若 设置 ， 则 将 输 
入 字符 回 显 到 终端 设备 。 在 规范 模式 和 非 规范 模式 下 都 可 以 回 显 输入 字符 。 
(c_lflag, FreeBSD. Linux. Mac OS X, Solaris) 若 设置 并 且 也 设置 ECHO, 
则 除 ASCI TAB. ASCII NL 以 及 START 和 STOP 字符 外 ， 其 他 ASCII 控制 字 
ff CASCII 字符 集中 0 至 八进制 37 对 应 的 字符 ) 都 被 回 显 为 ^ 吕 其中, 天 是 相 
应 控制 字符 加 上 八进制 100 所 构成 的 字符 。 例 如 ，ASCI Ctrl+A 字符 (八进制 1) 
被 回 显 为 ^A。ASCII DELETE 字符 (八进制 177)〉 则 回 显 为 ^?。 若 未 设置 此 标 
志 ， 则 ASCH 控制 字符 按 其 原样 回 显 。 如 同 ECHO 标志 ， 在 规范 模式 和 非 规范 
模式 下 ， 此 标志 对 控制 字符 回 显 都 起 作用 。 

应 当 了 解 的 是 , 某 些 系统 以 不 同方 式 回 显 EOF 字符, 因为 EOF 的 典型 值 是 Ctrl+D 
(而 Ctrl+D Æ ASCH EOT 字符 ， 它 可 能 使 某 些 终端 挂 断 )。 请 查看 有 关 手 册 。 
(c_lflag, POSIX.1, FreeBSD, Linux, Mac OS X, Solaris) 若 设 置 并 且 也 设 
置 ICANON, Jil] ERASE 字符 从 显示 中 擦 除 当 前 行 中 的 最 后 一 个 字符 。 这 通常 是 
在 终端 驱动 程序 中 写 一 个 3 字符 序列 实现 的 ， 该 序列 是 : 退 格 、 空 格 、 退 格 。 
若 支持 WERASE 字符 ， 则 ECHOE 用 一 个 或 若干 个 上 述 3 字符 序列 擦 除 前 一 个 字 。 
若 支 持 ECHOPRT 标志 ， 则 这 里 说 明 的 关于 ECHOE 的 动作 是 在 假定 未 设置 
ECHOPRT 标志 的 条 件 下 得 出 的 。 

(c_lflag, POSIX.1, FreeBSD, Linux, Mac OS X, Solaris) 若 设置 并 且 也 设 
置 ICANON， 则 KILL 字符 从 显示 中 擦 除 当 前 行 ， 或 者 输出 NL 字符 (用 以 强调 
己 擦 除 整个 行 )。 

车 支持 ECHOKE 标志 , 则 关于 ECHOK 的 说 明 是 在 假定 未 设置 ECHOKE 标志 的 条 
件 下 得 出 的 。 
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ECHOKE (c_lflag, FreeBSD. Linux. MacOS X, Solaris) 若 设置 并 且 也 设置 ICANON, 
则 回 显 KILL 字符 的 方式 是 擦 除 行 中 的 每 一 个 字符 。 擦 除 每 个 字符 的 方法 则 由 
ECHOE fil ECHOPRT 标志 选择 。 


ECHONL (c_1flag，POSIX.1、FreeBSD、Linux、Mac OS X. Solaris) 车 设置 并 且 也 设 
置 ICANON， 即 使 没有 设置 EcCHO， 也 回 显 NL 字符 。 
ECHOPRT (c_lflag, FreeBSD, Linux, Mac OS X, Solaris) 若 设置 并 且 也 设置 ICANON 


和 ECHO, Jl ERASE 字符 (以 及 WERASE 字符 ， 若 受到 支持 ) 使 所 有 正 被 擦 
除 的 字符 按 它 们 被 擦 除 的 方式 被 打印 。 这 一 方法 常 在 硬 拷贝 终端 上 显示 其 作用 ， 
它 可 以 使 我 们 确切 地 看 到 哪些 字符 正 被 删除 。 

EXTPROC (c_lflag, FreeBSD. Linux, Mac OS X) 若 设置 ， 规 范 字 符 处 理 在 操作 系统 
之 外 执行 。 如 果 串 行 通信 外 设 卡 能 够 通过 执行 某 些 行规 程 处 理 减 轻 主机 处 理 器 
负载 ， 那 么 就 可 以 这 样 设置 。 在 使 用 伪 终 端 时 ( 见 第 19 章 )， 也 可 以 这 样 设 置 。 


FFDLY (c_oflag, XSI, Linux, Solaris) 换 页 延迟 屏蔽 字 。 此 屏蔽 字 标 志 值 是 FFO 或 FF1。 
FLUSHO (c_lflag, FreeBSD, Linux, Mac OS X, Solaris) 若 设置 ， 则 冲洗 输出 。 当 


键入 DISCARD 字符 时 设置 此 标志 。 当 键入 另 一 个 DISCARD 字符 时 ， 此 标志 
被 清除 。 可 以 通过 设置 或 清除 此 终端 标志 来 设置 或 清除 此 条 件 。 

HUPCL (c cflag, POSIX.1. FreeBSD, Linux. Mac OS X, Solaris) 若 设置 ， 则 当 最 
后 一 个 进程 关闭 设备 时 ， 调 制 解 调 器 控制 线 降 至 低 电 平 〈 也 就 是 调制 解 调 器 的 
连接 断 开 )。 

ICANON (c_lflag, POSIX.1, FreeBSD, Linux, Mac OS X, Solaris) 若 设 置 ， 则 按 规 
范 模式 工作 〈 见 18.10 节 )。 这 使 下 列 字符 起 作用 : EOF、EOL、EOL2、ERASE、 
KILL, REPRINT. STATUS 和 WERASE。 输 入 字符 被 装配 成 行 。 
如 果 不 以 规范 模式 工作 ， 则 读 请 求 直接 从 输入 队列 取 字 符 。 在 至 少 接 到 MIN 个 字 
节 或 两 个 字 节 之 间 的 超时 值 TIME 到 期 时 ，read 才 返 回 。 详 细 情 况 参见 18.11 节 。 


ICRNL (c_iflag, POSIX.1, FreeBSD, Linux, Mac OS X, Solaris) 若 设置 并 且 未 设 
置 IGNCR， 则 将 接收 到 的 CR 字符 转换 成 NL 字符 。 

IEXTEN (c_lflag, POSIX.1, FreeBSD, Linux, Mac OS X, Solaris) 若 设置 ， 则 识别 
并 处 理 扩展 的 、 由 实现 定义 的 特殊 字符 。 

IGNBRK (c_iflag, POSIX.1, FreeBSD. Linux, Mac OS X, Solaris) 在 已 设置 时 ， 忽 


略 输入 中 的 BREAK 条 件 。 关 于 BREAK 条 件 是 产生 SIGINT 信号 还 是 被 作为 
数据 读 取 ， 见 BRKINT。 


IGNCR (c_iflag, POSIX.1, FreeBSD. Linux, Mac OS X, Solaris) 若 设 置 ， 则 忽略 
接收 到 的 CR 字符 。 若 未 设置 此 标志 ， 而 设置 了 ICRNL 标志 ， 则 有 可 能 将 接收 
到 的 CR 字符 转换 成 NL 字符 。 

IGNPAR (c_iflag, POSIX.1, FreeBSD. Linux. Mac OS X. Solaris) TELLE EN, @ 
略 带 有 结构 出 错 ( 非 BREAK) 或 奇偶 出 错 的 输入 字 节 。 

IMAXBEL (c_iflag, FreeBSD. Linux, Mac OS X. Solaris) 当 输 入 队列 满 时 响 铃 。 

INLCR (c iflag, POSIX.1, FreeBSD, Linux, Mac OS X, Solaris) 若 设 置 ， 则 将 接 


收 到 的 NL 字符 转换 成 CR 字符 。 
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INPCK 


ISIG 


ISTRIP 
IUCLC 
IUTF8 


IXANY 


IXOFF 


IXON 


MDMBUF 


NLDLY 
NOFLSH 


NOKERNINFO 


OCRNL 
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(c_iflag, POSIX.1, FreeBSD, Linux, Mac OS X, Solaris) 在 已 设置 时 ， 使 
输入 奇偶 校 验 起 作用 。 若 未 设置 INPCK， 则 使 输入 奇偶 校 验 不 起 作用 。 

奇偶 “产生 和 检测 ”和 “输入 奇偶 校 验 ” 是 两 件 不 同 的 事 。 奇 偶 位 的 产生 和 检 
测 是 由 PARENB 标志 控制 的 。 设 置 该 标志 后 通常 会 使 串 行 接口 的 设备 驱动 程序 
对 输出 字符 产生 奇偶 位 ， 对 输入 字符 则 验证 其 奇偶 性 。PRARODD 标志 决定 该 奇 
偶 性 应 当 是 奇 还 是 偶 。 如 果 一 个 其 奇偶 性 错误 的 输入 字符 到 来 ， 则 检查 INPCK 
标志 的 状态 。 若 已 设置 此 标志 ， 则 检查 IGNPAR 标志 (以 决定 是 否 应 忽略 带 奇 
偶 出 错 的 输入 字 节 ); 若 不 应 忽略 此 输入 字 节 ， 则 检查 PARMRK 标志 以 决定 应 该 
向 读 进程 传送 哪些 字符 。 

(c_lflag, POSIX.1, FreeBSD. Linux. Mac OS X. Solaris) 若 设置 ， 则 判别 
输入 字符 是 否 是 要 产生 终端 信号 的 特殊 字符 (INTR、QUIT、SUSP 和 DSUSP); 
若是 ， 则 产生 相应 信号。 

(c iflag, POSIX.l. FreeBSD. Linux, Mac OS X. Solaris) 在 已 设置 此 标志 
时 ， 有 效 输入 字 节 被 剥离 为 7 位。 在 未 设置 时 ， 则 处 理 全 部 8 位 。 

(c_iflag, Linux, Solaris) 将 输入 的 大 写字 符 转 换 成 小 写字 符 。 

(c_iflag, Linux. MacOS X) 允许 使 用 UTF-8 多 字 节 字符 进行 字符 擦 除 处 理 。 
(c_iflag, XSI, FreeBSD. Linux, Mac OS X. Solaris) 使 任何 字符 都 能 重新 
启动 输出 。 

(c_iflag, POSIX.1、FreeBSD、Linux、Mac OS X、Solaris) 若 设置 ， 则 使 启 
动 -停止 输入 控制 起 作用 。 当 终端 驱动 程序 发 现 输入 队列 将 要 填 满 时 , 输出 一 个 
STOP 字符 。 此 字符 应 当 由 发 送 数据 的 设备 识别 ， 并 使 该 设备 停止 。 此 后 ， 当 把 
输入 队列 中 的 字符 处 理 完 毕 之 后 ， 终 端 驱动 程序 将 输出 一 个 START 字符 ,使 该 
(c_iflag, POSIX.1, FreeBSD. Linux, Mac OS X. Solaris) 若 设置 ， 则 使 启 
动 -停止 输出 控制 起 作用 。 当 终端 驱动 程序 接收 到 一 个 STOP 字符 时 ， 输 出 停止 。 

在 输出 停止 时 ， 下 一 个 START 字符 恢复 输出 。 若 未 设置 此 标志 ， 则 START 和 
STOP 字符 由 进程 作为 一 般 字 符 读 取 。 

(c_cflag, FreeBSD. Mac OS XO 按照 调制 解 调 器 的 载波 标志 进行 输出 流 控 制 。 
这 是 CCAR_OFLOW 标志 的 曾 用 名 。 

(c_oflag, XSI, Linux, Solaris) 换行 延迟 屏蔽 字 。 此 屏蔽 字 的 值 是 NL0 8€ NL1. 
(c_lflag, POSIX.1, FreeBSD. Linux. Mac OS X. Solaris) 按 系 统 默 认 ， 当 
终端 驱动 程序 产生 SIGINT 和 SIGQUIT 信号 时 ， 输 入 和 输出 队列 都 被 冲洗 。 

另外 ， 当 它 产 生 SIGSUSP 信号 时 ， 输 入 队列 被 冲洗 。 若 已 设置 NOFLSH 标志 ， 

则 在 这 些 信 号 产生 时 ， 不 对 输入 、 输 出 队列 进行 常规 冲洗 。 

(c lflag, FreeBSD. Mac OS XO 在 已 设置 时 ， 此 标志 阻止 STATUS 字符 打印 
前 台 进 程 组 的 信息 。 但 是 无 论 是 否 设置 此 标志 ，STATUS 字符 都 会 使 SIGINFO 
信和 号 被 发 送 至 前 台 进 程 组 。 

(c_oflag, XSI, FreeBSD. Linux. Solaris) 若 设置 ， 则 将 输出 的 CR 字符 转 
换 成 NL 字符 。 
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OFDEL (c oflag, XSI, Linux, Solaris) 若 设置 ， 则 输出 填充 字符 是 ASCI DEL; 7; 
则 是 ASCIT NUL。 见 OFILL 标志 。 
OFILL (c_oflag, XSI, Linux, Solaris) 若 设置 ， 则 传递 填充 字符 (ASCI DEL 或 


ASCIINUL， 见 OFDEL 标志 ) 以 实现 延迟 ， 而 不 使 用 时 间 延 迟 。 见 6 个 延迟 屏 
蔽 字 标 志 : BSDLY. CRDLY. FFDLY. NLDLY. TABDLY 和 VTDLY. 


OLCUC (c_oflag, Linux, Solaris) 若 设置 ， 则 将 小 写字 符 转 换 成 大 写字 符 。 689 

NLCR (c_oflag, XSI, FreeBSD. Linux, Mac OS X, Solaris) 若 设置 ， 将 输出 的 
NL 字符 转换 成 CR-NL 字符 。 

ONLRET (c_oflag, XSI, FreeBSD. Linux, Solaris) 若 设置 ， 则 假定 输出 的 NL 字符 
执行 回 车 功能 。 

ONOCR (c oflag. XSI, FreeBSD. Linux. Solaris) FRE, WA 0 列 不 输出 CR 字符 。 

ONOEOT (c_oflag, FreeBSD. Mac OS XO 若 设置 ， 则 在 输出 中 丢弃 EOT OD) 字符 。 
在 某 些 将 Ctrl+D 解释 为 挂 断 的 终端 上 ， 设 置 此 标志 可 能 是 必需 的 。 

OPOST (c_oflag, POSIX.1, FreeBSD, Linux, Mac OS X. Solaris) 若 设置 ， 则 进行 
实现 定义 的 输出 处 理 。 关 于 c oflag 字段 的 各 种 实现 定义 标志 ， 见 图 18-6. 

OXTABS (c_oflag, FreeBSD. MacOS X) 若 设置 ， 则 制 表 符 在 输出 中 被 扩展 为 空格 。 
这 与 将 水 平 制 表 符 延迟 (TABDLY) 设置 为 XTABS 或 TAB3 所 产生 的 效果 相同 。 

PARENB (c_cflag，POSIX.1、FreeBSD、Linux、Mac OS X. Solaris) 若 设置 ， 则 对 输出 


字符 产生 奇偶 位 ， 对 输入 字符 执行 奇偶 校 验 。 若 已 设置 PARODD， 则 奇偶 校 验 是 
ARK: 否则 是 偶 校 验 。 另 见 对 INPCK、IGNPAR 和 PARMRK 标志 的 讨论 。 


PAREXT (c_cflag, Solaris) 选择 标记 或 空 奇 偶 性 。 若 PARODD 设置 ， 则 奇偶 位 总 是 1 
(标记 奇偶 性 );， 和 否则， 奇偶 位 总 是 0〈 空 奇偶 性 )。 
PARMRK (c_iflag, POSIX.l. FreeBSD. Linux. Mac OS X. Solaris) 在 已 设置 时 ， 


ERRA IGNPAR， 则 带 有 结构 出 错 (JE BREAK) 的 字 节 或 带 有 奇偶 出 错 的 
字 节 将 被 进程 读 作 一 个 3 字符 序列 \377、\0 AX, 其 中 外 是 接收 到 的 出 错字 
节 。 若 未 设置 TSTRIP， 则 一 个 有 效 的 \377 被 传送 给 进程 时 为 \377，\377。 
若 未 设置 IGNPAR 和 PARMRK, 则 带 有 结构 出 错误 或 奇偶 出 错 的 字 节 都 被 读 作 
一 个 字符 \0。 

PARODD (c_cflag, POSIX.1, FreeBSD, Linux. Mac OS X. Solaris) 若 设置 ， 则 输出 
和 输入 字符 的 奇偶 性 都 是 奇 ， 否 则 为 偶 。 注 意 ，PARENB 标志 控制 奇偶 性 的 产 
生 和 检测 。 
在 已 设置 CMSPAR 或 PAREXT 标志 时 ，PARODD 标志 也 控制 是 否 使 用 标记 或 空 
奇偶 性 。 

PENDIN (c_lflag, FreeBSD. Linux, Mac OS X, Solaris) 若 设 置 ， 则 在 下 一 个 字符 
输入 时 ， 尚 未 读 的 任何 输入 都 由 系统 重新 打印 。 这 一 动作 与 键入 REPRINT 字符 
时 的 作用 相 类 似 。 

TABDLY (c_oflag, XSI, Linux, Mac OS X, Solaris) 水 平 制 表 符 延迟 屏蔽 字 。 此 屏蔽 
字 的 值 是 TAB0、TAB1、TAB2 或 TAB3. 
xTABS 的 值 等 于 TAB3。 此 值 使 系统 将 制 表 符 扩展 成 空格 。 系 统 假定 制 表 符 的 
长 度 为 8 个 空格 ， 不 能 更 改 此 假定 。 
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TOSTOP (c_1flag，POSIX.1、FreeBSD、Linux、Mac OS X. Solaris) Zi E, JEHiX 
实现 支持 作业 控制 ， 则 将 信号 SIGTTOU 送 到 试图 写 控制 终端 的 一 个 后 台 进 程 的 
进程 组 。 按 默认 ， 此 信号 暂停 该 进程 组 中 所 有 进程 。 如 果 写 控制 终端 的 后 台 进 
程 忽略 或 阻塞 此 信号 ， 则 终端 驱动 程序 不 产生 此 信和 号。 


VTDLY (c_oflag, XSI, Linux, Solaris) 垂直 制 表 延迟 屏蔽 字 。 此 屏蔽 字 的 值 是 VT0 
和 VT1。 
XCASE (c lflag, Linux, Solaris) 若 设 置 ， 并 且 也 设置 ICANON， 则 终端 被 假定 为 只 


支持 大 写字 符 ， 全 部 输入 转换 为 小 写字 符 。 要 想 输 入 一 个 大 写字 符 ， 要 在 其 前 
面 加 一 个 反 斜 本 。 与 之 类 似 ， 系 统 箱 出 大 写字 符 时 ， 也 要 在 其 前 面 加 一 个 反 斜 
杠 。( 如 今 这 个 选项 标志 已 弃 用 ， 因 为 只 支持 大 写字 符 的 终端 即使 不 是 全 部 ， 也 
是 绝 大 部 分 都 已 经 不 存在 了 。) 


18.6 stty 命令 


上 节 说 明 的 所 有 选项 都 可 以 被 检查 和 更 改 : 在 程序 中 用 tcgetattr 4I tcsetattr AM 
( 见 18.4 节 ) 进行 检查 和 更 改 ;， 在 命令 行 (或 shell 脚本 ) 中 用 stty(1) 命 令 进行 检查 和 更 改 。 简 
单 地 说 ，stty(1) 命 令 就 是 图 18-7 中 所 列 的 前 6 个 函数 的 接口 。 如 果 以 -a 选项 执行 此 命令 ， 则 显 
示 终 端的 所 有 选项 : 


$ stty -a 

speed 9600 baud; 25 rows; 80 columns; 

lflags: icanon isig iexten echo echoe -echok echoke -echonl echoctl 
-echoprt -altwerase -noflsh -tostop -flusho pendin -nokerninfo 
-extproc 

iflags: -istrip icrnl -inlcr -igncr ixon -ixoff ixany imaxbel -ignbrk 
brkint -inpck -ignpar -parmrk 

oflags: opost onlcr -ocrnl -oxtabs -onocr -onlret 

cflags: cread cs8 -parenb -parodd hupcl -clocal -cstopb -crtscts 
-dsrflow -dtrflow -mdmbuf 

cchars: discard = ^O; dsusp = ^Y; eof = ^D; eol = <undef>; 
eol2 = <undef>; erase = ^H; erase2 = ^?; intr = ^C; kill = ^U; 
lnext = ^V; min = 1; quit = ^; reprint = ^R; start = ^Q; 
status = ^T; stop = ^S; susp = ^Z; time = 0; werase = ^W; 


若 在 选项 名 前 有 一 个 连 字 符 ， 表 示 该 选项 禁用 。 最 后 4 行 显示 各 终端 特殊 字符 〈 见 18.3 节 ) 
的 当前 设置 。 第 1 行 显示 当前 终端 窗口 的 行 数 和 列 数 ，18.12 节 将 对 终端 窗口 大 小 进行 讨论 。 
stty 命令 使 用 它 的 标准 输入 获得 和 设置 终端 的 选项 标志 。 虽然 , 某 些 较 早 的 实现 使 用 标准 输 
出 ， 但 POSIX.1 要 求 使 用 标准 输入 。 本 书 讨 论 的 4 种 实现 提供 了 在 标准 输入 上 操作 的 stty RA, 
这 意味 着 如 果 和 希望 了 解 名 为 ttyla 的 终端 的 设置 ， 那 么 可 以 键入 
stty -a </dev/ttyla 


18.7 RREAK 


术语 波 特 率 (baud rate) 是 一 个 历史 沿用 的 术语 ， 现 在 它 指 的 是 “位 / 秒 ”(bit per second). HAK 
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多 数 终端 设备 对 输入 和 输出 使 用 同一 波 特 率 ， 但 是 只 要 硬件 许可 ， 可 以 将 它们 设置 为 两 个 不 同 值 。 
#include <termios.h> 
speed t cfgetispeed(const struct termios *fermptr) ; 
speed t cfgetospeed(const struct termios *fermptr) 7 


两 个 函数 的 返回 值 : 波 特 率 值 


int cfsetispeed(struct termios *termptr, speed t speed); 


int cfsetospeed(struct termios *fermptr, speed t speed) ; 
两 个 函数 的 返回 值 ， 若 成 功 ， 返 回 0; 出 错 ， 返 回 -1 
两 个 cfget 函数 的 返回 值 ， 以 及 两 个 cfset 函数 的 speed 参数 都 是 下 列 常量 之 一 : B50, 
B75. B110、B134、B150、B200、B300、B600、B1200、B1800、B2400、B4800、B9600、 
B19200 或 B38400。 常 量 BO 表示 “ 挂 断 ” 在 调用 tcsetattr 时 ， 如 若 将 输出 波 特 率 指定 为 
B0， 则 调制 解 调 器 的 控制 线 就 不 再 起 作用 。 


大 多 数 系 统 定义 了 另外 的 波 特 率 值 ， 如 B57600 以 及 B115250。 


使 用 这 些 函 数 时 ， 必 须 认识 到 输入 、 输 出 波 特 率 是 存储 在 设备 的 termios 结构 中 的 ， 如 图 18-8 
所 示 。 在 调用 两 个 cfget 函数 中 的 任意 一 个 之 前 ， 要 先 用 tcgetattr 获得 设备 的 termios Zi 
构 。 与 此 类 似 ， 在 调用 两 个 cfset 函数 中 的 任意 一 个 之 后 ， 要 做 的 就 是 在 termios 结构 中 设置 
波 特 率 。 为 使 这 种 更 改 影 响 到 设备 ， 应 当 调 用 tcsetattr 函数 。 即 使 所 设置 的 两 个 波 特 率 中 的 
任意 一 个 出 错 ， 在 调用 tcsetattr 之 前 可 能 也 不 会 发 现 这 个 错误 。 
这 4 个 波 特 率 函 数 的 存在 使 应 用 程序 不 必 考 虑 具体 实现 在 termios 结构 中 表示 波 特 率 的 不 同 
方法 。Linux 和 BSD 派生 的 平台 趋向 于 存储 波 特 率 的 数值 。( 即 9 600 波 特 率 存储 成 值 9 600)， 然 
ifj, System V 派生 的 平台 (如 Solaris) 趋向 于 以 位 屏蔽 方式 编码 波 特 率 。 从 cfget 函数 得 到 的 速 
度 值 以 及 向 cfset 函数 传送 的 速度 值 都 未 转换 ， 与 它们 存储 在 termios 结构 中 的 表示 形式 一 样 。 


18.8 行 控制 函数 


PS 4 个 函数 提供 了 终端 设备 的 行 控制 能 力 。4 个 函数 都 要 求 参 数 fa 引用 一 个 终端 设备 ， 否 
则 出 错 返 回 -1，errno 设置 为 ENOTTY。 


#include <termios.h> 





int tcdrain(int fd); 
int tcflow(int fd, int action); 


int tcflush(int fd, int queue); 


int tcsendbreak(int fd, int duration); 





4 个 函数 的 返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 


tcdrain 函数 等 待 所 有 输出 都 被 传递 。tcflovw 函数 用 于 对 输入 和 输出 流 控 制 进行 控制 。 
action 参数 必定 是 下 列 4 个 值 之 一 。 

TCOOFF 输出 被 挂 起 。 

TCOON 重新 启动 以 前 被 挂 起 的 输出 。 

TCIOFF 系统 发 送 一 个 STOP 字符 ， 这 将 使 终端 设备 停止 发 送 数 据 。 
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TCION 系统 发 送 一 个 START 字符 ， 这 将 使 终端 设备 恢复 发 送 数据 。 

tcflush 函数 冲洗 (抛弃) 输入 缓冲 区 (其 中 的 数据 是 终端 驱动 程序 已 接收 到 ,但 用 户 程 序 
尚未 读 取 的 ) 或 输出 缓冲 区 (其 中 的 数据 是 用 户 程 序 已 经 写 入 ,但 尚未 被 传递 的 )。gqueue 参数 必 
定 是 下 列 3 个 常量 之 一 。 

TCIFLUSH 冲洗 输入 队列 。 

TCOFLUSH 冲洗 输出 队列 。 

TCIOFLUSH 冲洗 输入 队列 和 输出 队列 。 

tcsendbreak 函数 在 一 个 指定 的 时 间 区 间 内 发 送 连续 的 0 值 位 流 。 若 duration 参数 为 0， 

则 此 种 传递 延续 0.25 一 0.5 秒 。POSIX.1 说 明 若 duration 非 0， 则 传递 时 间 依 赖 于 实现 。 


18.9 ”终端 标识 


历史 上 ， 在 大 多 数 UNIX 系统 版 本 中 ， 控 制 终端 的 名 字 一 直 是 /dev/tty。POSIX.1 提供 了 
一 个 运行 时 函数 ， 可 用 来 确定 控制 终端 的 名 字 。 
#include <stdio.h> 


char *ctermid(char *ptr); 


返回 值 : 若 成 功 ， 返 回 指向 控制 终端 名 的 指针 ; 若 出 错 ， 返 回 指向 空 字符 串 的 指针 





如 果 pm 非 空 ， 则 被 认为 是 一 个 指针 ， 指 向 长 度 至 少 为 L_ctermid 字 节 的 数组 ， 进 程 的 控 
制 终端 名 存储 在 该 数组 中 。 常 量 L ctermid 被 定义 在 <stdio.h> 中 。 若 ptr 是 一 个 空 指针 ， 则 
该 函数 为 数组 (通常 作为 静态 变量 ) 分 配 空间 。 同 样 ， 进 程 的 控制 终端 名 存储 在 该 数组 中 。 

在 这 两 种 情况 中 ， 该 数组 的 起 始 地 址 都 被 作为 函数 值 返回 。 因 为 大 多 数 UNIX 系统 都 使 用 
/dev/tty 作为 控制 终端 名 ， 所 以 此 函数 的 主要 作用 是 改善 向 其 他 操作 系统 的 可 移植 性 。 


当 调 用 ctermid 函数 时 ， 本 书 说 明 的 所 有 4 种 平台 都 返回 字符 串 /dev/ttyo。 


a Xfi: ctermid 函数 
图 18-12 给 出 的 是 POSIX.1 ctermid 函数 的 一 个 实现 。 


#include <stdio.h> 
#include <string.h> 


static char ctermid_name[L_ctermid]; 
char * 


ctermid(char *str) 


{ 


if (str == NULL) 
str = ctermid_name; 
return(strcpy(str, "/dev/tty")); /* strcpy() returns str */ 
) 
图 18-12 POSIX.1 ctermid 函数 的 实现 


注意 ， 因 为 我 们 无 法 确定 调用 者 的 缓冲 区 大 小 ， 所 以 也 就 不 能 防止 过 度 使 用 该 缓冲 区 。 m 
另外 还 有 两 个 UNIX 系统 比较 感 兴趣 的 函数 : isatty 和 ttyname。 如 果 文 件 描 述 符 引 用 一 
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个 终端 设备 ， 则 isatty 返回 真 。ttyname 返回 的 是 在 该 文件 描述 符 上 打开 的 终端 设备 的 路 径 名 。 


#include <unistd.h> 


int isatty(int fd); 


返回 值 : 若 为 终端 设备 ， 返 回 1〈 真 );， 否则 ， 返 回 0 ( 假 ) 


char *ttyname(int fd); 





返回 值 ， 指 向 终端 路 径 名 的 指针 ， 若 出 错 ， 返 回 NULL 


g Xil: isatty Á% 
如 图 18-13 所 示 ，isatty 函数 很 容易 实现 。 我 们 只 尝试 使 用 了 其 中 一 个 终端 专用 函数 (如 
果 成 功 执行 ， 它 不 改变 任何 东西 )， 并 查看 了 其 返回 值 。 


#include «termios.h» 
int 
isatty(int fd) 


{ 
struct termios ts; 


return(tcgetattr(fd, &ts) != -1); /* true if no error (is a tty) */ 


图 18-13 POSIX.l isatty 函数 的 实现 
使 用 图 18-14 中 的 程序 测试 isatty 函数 。 


#include "apue.h" 


int 
main (void) 


{ 


printf("fd 0: s\n", isatty(0) ? "tty" : "not a tty"); 
printf("fd 1; Ss\n",, isatty(l) ? "tty" 3 "not a tty"); 
printf("fd 2: $sMn", isatty(2) ? "tty" : "not a tty"); 
exit(0); 
| —Á— ———————————————— Hn 
图 18-14 测试 isatty 函数 
运行 图 18-14 中 的 程序 ， 得 到 如 下 输出 : 
$ ./a.out 
fd 0: tty 
rd Is tty 
fd 2: tty 
$ ./a.out </etc/passwd 2»/dev/null 
fd 0: not a tty 
fd 1: tty 
fd 2: not a tty B 


eX: ttyname Až 
ttyname 函数 ( 见 图 18-15〉 比 较 长 ， 因 为 它 要 搜索 所 有 设备 表 项 ， 寻 找 巨 配 项 。 
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#include <sys/stat.h> 
#include <dirent.h> 
#include <limits.h> 
#include <string.h> 
#include <termios.h> 
#include <unistd.h> 
#include <stdlib.h> 


struct devdir { 


struct devdir *d next; 
char *d name; 
] 
static struct devdir *head; 
static struct devdir *tail; 
static char pathname[ POSIX PATH MAX + 1]; 


static void 

add(char *dirname) 

{ 
struct devdir *ddp; 
int len; 


len = strlen (dirname); 


/* 

* Skip ., .., and /dev/fd. 

xy 

if ((dirname[len-1] == '.') && (dirname[len-2] == '/' || 

(dirname[len-2] == '.' && dirname[len-3] -- '/'))) 

return; 

if (strcmp(dirname, "/dev/fd") == 0) 
return; 

if ((ddp = malloc(sizeof(struct devdir))) -- NULL) 
return; 

if ((ddp-»d name = strdup(dirname)) == NULL) { 
free (ddp); 
return; 


ddp-»d next = NULL; 
if (tail == NULL) { 


head = ddp; 
tail - ddp; 
) else ( 
tail-»d next = ddp; 
tail = ddp; 


static void 
cleanup (void) 


{ 
struct devdir *ddp, *nddp; 


18.9 


ddp = head; 

while (ddp != NULL) { 
nddp = ddp->d_next; 
free (ddp->d_name) ; 
free (ddp); 
ddp = nddp; 


Zt 

oO 

m 

a 
1 


= NULL; 
tail = NULL; 


static char * 
searchdir(char *dirname, struct stat *fdstatp) 


{ 


struct stat devstat; 
DIR *dp; 

int devlen; 
struct dirent *dirp; 


strcpy(pathname, dirname); 

if ((dp = opendir(dirname)) -- NULL) 
return (NULL); 

strcat(pathname, "/"); 

devlen - strlen(pathname); 

while ((dirp = readdir(dp)) != NULL) { 
strncpy(pathname + devlen, dirp-»d name, 

POSIX PATH MAX - devlen); 


/* 
* Skip aliases. 
wy 
if (strcmp(pathname, "/dev/stdin") == 0 || 
strcmp(pathname, "/dev/stdout") == 0 || 
strcmp(pathname, "/dev/stderr") == 0) 
continue; 
if (stat(pathname, &devstat) < 0) 
continue; 


if (S_ISDIR(devstat.st_mode)) { 
add (pathname) ; 


continue; 
} 
if (devstat.st_ino == fdstatp->st_ino && 
devstat.st_dev == fdstatp->st_dev) { /* found a match */ 


closedir (dp); 
return (pathname) ; 


closedir (dp); 
return (NULL); 


char * 
ttyname (int fd) 


{ 


终端 标识 
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struct stat fdstat; 
struct devdir *ddp; 
char *ryal; 
if (isatty(fd) == 0) 


return (NULL); 

if (fstat(fd, &fdstat) < 0) 
return (NULL); 

if (S ISCHR(fdstat.st mode) -- 0) 
return (NULL); 


rval = searchdir("/dev", &fdstat); 


if (rval == NULL) { 
for (ddp = head; ddp != NULL; ddp = ddp-»^d next) 
if ((rval = searchdir(ddp-»d name, &fdstat)) != NULL) 
break; 
) 
cleanup(); 


return(rval); 


图 18-15 POSIX.1 ttyname 函数 的 实现 


此 处 使 用 的 技术 是 读 /dev 目录 ， 寻 找 具 有 相同 设备 号 和 i 节点 编号 的 表 项 。 回 忆 4.24 节 ， 
每 个 文件 系统 都 有 一 个 唯一 的 设备 号 〈stat 结构 中 的 st_dev 字段 ， 见 4.2 节 )， 文 件 系 统 
中 的 每 个 目录 项 都 有 一 个 唯一 的 i 节点 编号 (stat 结构 中 的 st ino 字段 )。 在 此 函数 中 ， 

假定 在 找到 一 个 匹配 的 设备 号 和 匹配 的 i 节点 号 时 , 就 能 找到 所 希望 的 目录 项 。 也 能 验证 这 两 

个 表 项 与 st_rdev 字段 (终端 设备 的 主 设备 号 和 次 设备 号 ) 相 匹配 ， 还 能 验证 该 目录 项 是 一 
个 字符 特殊 文件 。 但 是 ， 因 为 已 经 验证 了 文件 描述 符 参 数 既是 一 个 终端 设备 ， 又 是 一 个 字符 
特殊 文件 ， 而且 因 为 在 UNIX 系统 中 ,匹配 的 设备 号 和 i 节点 编号 是 唯一 的 ， 所 以 不 再 需要 进 
行 另 外 的 比较 。 

终端 名 可 能 在 /dev 的 子 目 录 中 。 于 是 ， 需 要 搜索 /dev 下 的 整个 文件 系统 树 。 我 们 跳 过 了 少 
数 几 个 可 能 会 产生 不 正确 结果 或 奇怪 结果 的 目录 : /dev/.、/dev/.. 和 /dev/fd。 我 们 也 跳 过 
了 一 些 别 名 : /dev/stdin. /dev/stdout 以 及 /dev/stderr， 因 为 它们 是 /dev/fd 目录 中 
文件 的 符号 链接 。 

使 用 图 18-16 中 的 程序 测试 这 一 实现 。 


#include "apue.h" 


int 
main (void) 
{ 
char *name; 
if (isatty(0)) { 
name = ttyname (0); 
if (name == NULL) 
name = "undefined"; 
) else { 
name - "not a tty"; 


} 
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printf("fd 0: %s\n", name); 


if (isatty(1)) { 
name - ttyname (1); 


if (name -- NULL) 
name - "undefined"; 
) else ( 
name = "not a tty"; 


} 
printf("fd 1: s\n", name); 


if (isatty(2)) { 

name = ttyname (2); 

if (name == NULL) 

name = "undefined"; 

} else { 

name = "not a tty"; 
} 
printf("fd 2: s\n", name); 


exit (0); 


图 18-16 测试 ttyname 函数 
运行 图 18-16 中 的 程序 ， 得 到 : 
$ ./a.out < /dev/console 2» /dev/null 
fd 0: /dev/console 


fd 1: /dev/ttys001 
fd 2: not a tty L| 


18.10 ”规范 模式 


规范 模式 很 简单 : 发 一 个 读 请 求 ， 当 一 行 已 经 输入 后 ， 终 端 驱 动 程序 即 返回 。 以 下 几 个 条 件 
造成 读 返 回 。 

。 所 请 求 的 字 节 数 已 读 到 时 ， 读 返回 。 无 需 读 一 个 完整 的 行 。 如 果 读 了 部 分 行 ， 那 么 也 不 
会 丢失 任何 信息 ， 下 一 次 读 从 前 一 次 读 的 停止 处 开始 。 

© 当 读 到 一 个 行 定 界 符 时 ， 读 返回 。 回 忆 18.3 节 ， 在 规范 模式 中 ， 下 列 字符 被 解释 为 “ 行 
结束 ”: NL、EOL、EOL2 和 EOF。 另 外 ， 在 18.5 节 中 也 曾 说 明 ， 如 若 已 设置 ICRNL， 
但 未 设置 IGNCR， 则 CR 字符 的 作用 与 NL 字符 一 样 ， 也 终止 一 行 。 
在 这 5 个 行 界定 符 中 ， 只 有 一 个 EOF 符 在 终端 驱动 程序 对 其 进行 处 理 后 即 被 丢弃 。 其 他 
4 个 字符 则 作为 其 所 处 行 的 最 后 一 个 字符 返回 给 调用 者 。 

。 如 果 捕 捉 到 信号 ， 并 且 该 函数 不 再 自动 重启 〈 见 10.5 节 )， 则 读 也 返回 。 


加 实例 : getpass 函数 

下 面 说 明 getpass 函数 ， 它 读 入 用 户 在 终端 上 键入 的 口令 。 此 函数 由 login(1) 和 crypt(1) 
程序 调用 。 为 了 读 取 口 令 ， 该 函数 必须 关闭 回 显 ， 但 仍 可 使 终端 以 规范 模式 进行 工作 ， 因 为 不 管 
键入 什么 作为 口令 都 能 构成 一 个 完整 行 。 图 18-17 显示 了 UNIX 系统 中 的 一 个 典型 实现 。 
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#include <signal.h> 

#include <stdio.h> 

#include <termios.h> 

#define MAX PASS LEN 8 /* max #chars for user to enter */ 
char * 


getpass(const char *prompt) 


{ 


sta 
cha 
sig 
str 
FIL 
int 


Af 
set 
sig 


sig 
sig 


tic char buf[MAX PASS LEN + 1]; /* null byte at end */ 
x *ptr; 
set t sig, osig; 
uct termios ts, ots; 
E *fp; 
c; 

((fp = fopen(ctermid(NULL), "r+")) == NULL) 

return (NULL) ; 
buf (fp, NULL); 


emptyset (&sig) ; 
addset (&sig, SIGINT); /* block SIGINT */ 
addset (&sig, SIGTSTP); /* block SIGTSTP */ 


sigprocmask(SIG BLOCK, &sig, &osig); /* and save mask */ 


tcgetattr(fileno(fp), &ts); /* save tty state */ 
ots = ts; /* structure copy */ 
ts.c lflag &= -(ECHO | ECHOE | ECHOK | ECHONL); 
tcsetattr(fileno(fp), TCSAFLUSH, &ts); 

fputs(prompt, fp); 

ptr = buf; 

while ((c = getc(fp)) != EOF && c != '\n') 


*pt 
put 


tcs 


if (ptr < &buf[MAX PASS LEN]) 
*ptrtb = oF 


r= 0; /* null terminate */ 
triot £p)? /* we echo a newline */ 
etattr(fileno(fp), TCSAFLUSH, &ots); /* restore TTY state */ 


sigprocmask(SIG SETMASK, &osig, NULL); /* restore mask */ 


fel 
ret 


ose (fp); /* done with /dev/tty */ 
urn (buf); 





图 18-17 getpass 函数 的 实现 


在 此 例 中 ， 应 当 考 虑 以 下 几 个 方面 。 


调用 ctermid 函数 打开 控制 终端 ， 而 不 是 直接 将 /dev/tty 写 在 程序 中 。 

只 是 读 、 写 控制 终端 ， 如 果 不 能 以 读 、 写 模式 打开 此 设备 则 出 错 返 回 。 还 有 一 些 其 他 的 
使 用 约定 。 在 GNU C 函数 库 版 本 中 ， 如果 不 能 以 读 、 写 模式 打开 控制 终端 ,， 则 getpass 
读 取 标准 输入 ， 写 到 标准 错误 。 在 Solaris 版 本 中 ， 如 果 不 能 打开 控制 终端 ， 则 getpass 
失败 。 

阻塞 两 个 信号 SIGINT 和 SIGTSTP。 如 果 不 这 样 做 ， 在 输入 INTR 字符 时 就 会 使 程序 异 
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常 中 止 ， 并 使 终端 仍 处 于 禁止 回 显 状态 。 与 此 相 类 似 ， 输 入 SUSP 字符 时 将 使 程序 停止 ， 

并 且 在 禁止 回 显 状态 下 返回 到 shell。 在 禁止 回 显 时 ， 我 们 选择 了 阻塞 这 两 个 信号 。 如 果 
这 两 个 信号 是 在 读 取 口令 期 间 产 生 的 ， 则 它们 会 一 直 被 保持 ， 直 到 getpass 返回 ， 阻 塞 
才 会 解除 。 也 有 其 他 方法 来 处 理 这 些 信号 。 有 些 getpass 版 本 忽略 SIGINT (保存 它 以 
前 的 动作 )， 在 返回 前 将 其 动作 恢复 为 以 前 的 值 。 这 就 意味 着 ， 在 该 信号 被 忽略 期 间 所 发 
生 的 这 种 信号 都 会 丢失 。 其 他 版 本 捕捉 SIGINT (保存 它 以 前 的 动作 )， 如 果 捕 捉 到 此 信 
号 ， 则 在 恢复 终端 状态 和 信和 号 动作 后 ， 用 kill 函数 发 送 此 信和 号。 没有 一 个 getpass 版 
本 捕捉 、 忽 略 或 阻塞 SIGOUIT， 所 以 输入 QUIT 字符 就 会 使 程序 异常 中 止 ， 并 且 很 可 能 
使 终端 保持 在 禁止 回 显 状 态 。 

请 注意 ， 某 些 shell, 尤其 是 Korn shell, 在 以 交互 方式 读 输 入 时 都 使 终端 处 于 回 显 状态 。 
这 些 shell 是 提供 命令 行 编辑 的 shell, 因此 在 每 次 输入 一 条 交互 命令 时 都 处 理 终 端 状态 。 
所 以 如 果 在 这 种 shell 下 调用 此 程序 ， 并 且 用 QUIT 字符 使 其 异常 中 止 ， 则 这 种 shell 可 
能 会 恢复 回 显 状态 。 其 他 不 提供 命令 行 编辑 的 shell (如 Bourne shell) 将 使 程序 异常 中 
止 ， 并 使 终端 保持 在 不 回 显 状态 。 如 果 对 终端 做 了 这 种 操作 ， 则 stty 命令 能 使 终端 恢 
复 到 回 显 状态 。 

使 用 标准 VO 读 、 写 控制 终端 。 我 们 特地 将 流 设置 为 不 带 缓冲 的 ， 否 则 在 流 的 读 、 写 之 间 
可 能 会 有 某 些 交 叉 〈 这 样 就 需要 多 次 调用 fftlush)。 也 可 使 用 不 带 缓冲 的 VO 〈 见 第 3 
章 )， 但 是 在 这 种 情况 下 就 只 能 用 read 来 模仿 getc 函数 。 


。 最 多 只 存储 8 个 字符 作为 口令 。 输 入 的 其 他 多 余 字 符 则 全 部 被 忽略 。 
图 18-18 中 的 程序 调用 getpass 并 且 打 印 我 们 输入 的 内 容 。 这 是 为 了 验证 ERASE 和 KILL 


字符 能 否 正 常 工作 (如 同 它们 在 规范 模式 下 应 该 表现 的 那样 )。 


#include "apue.h" 


char 


int 


*getpass(const char *); 


main (void) 


{ 


char *ptr; 


if ((ptr = getpass("Enter password:")) -- NULL) 


err sys("getpass error"); 


printf("password: %s\n", ptr); 


/* now use password (probably encrypt it) ... */ 
while (*ptr != 0) 

*ptrt++ = 0; /* zero it out when we're done with it */ 
exit (0); 


K 18-18 调用 getpass 函数 


如 果 调 用 getpass 函数 的 程序 使 用 的 是 明文 口令 ， 那 么 为 了 安全 起 见 ， 在 程序 完成 后 应 在 


内 存 中 清除 它 。 如 果 该 程序 会 产生 其 他 用 户 可 能 读 取 的 core 文件 (回忆 10.2 节 ，core 的 系统 
默认 许可 权 使 每 个 用 户 都 能 读 它 )， 或 者 如 果 某 个 其 他 进程 能 够 设法 读 该 进程 的 存储 空间 ， 则 它 
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们 就 可 能 会 读 到 这 个 明文 口令 。(“ 明文 ”是 指 我 们 在 getpass 打印 的 提示 符 处 键入 的 口令 。 大 
多 数 UNIX 系统 程序 会 对 这 个 明文 口令 进行 修改 ， 将 它 转 换 成 一 个 “加 密 ” 口 令 。 例 如 ， 口 令 文 
{F (W 6.2 节 ) 中 的 pw_passwd 字段 包含 的 是 加 密 口 令 ， 而 不 是 明文 口令 。) = 
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可 以 通过 关闭 termios 结构 中 c_1flag 字段 的 ICANON 标志 来 指定 非 规范 模式 。 在 非 规范 
模式 中 ， 输 入 数据 不 装配 成 行 ， 不 处 理 下 列 特殊 字符 〈 见 18.3 节 ): ERASE, KILL, EOF, NL. 
EOL、EOL2、CR、REPRINT、STATUS 和 WERASE. 
如 前 所 述 ， 规 范 模 式 很 容易 理解 : 系统 每 次 至 多 返回 一 行 。 但 在 非 规范 模式 下 ， 系 统 如 何 
知道 在 什么 时 候 将 数据 返回 给 我 们 呢 ? 如 果 它 一 次 返回 一 个 字 节 ,那么 系统 开销 就 会 过 大 。( 回 
忆 图 3-6， 从 中 可 以 看 到 每 次 读 一 个 字 节 的 开销 有 多 大 。 如 果 每 次 返回 的 数据 加 倍 ， 那 么 系统 调 
用 的 开销 就 可 以 减 半 。) 在 启动 读数 据 之 前 ， 往 往 不 知道 要 读 多 少数 据 ， 所 以 系统 不 能 总 是 一 次 
返回 多 个 字 节 。 
解决 方法 是 ， 当 已 读 了 指定 量 的 数据 后 ， 或 者 已 经 超过 了 给 定量 的 时 间 后 ， 即 通知 系统 返回 。 
这 种 技术 使 用 了 termios 结构 中 c cc 数组 的 两 个 变量 : MIN fl TIME. c cc 数组 中 的 这 两 个 
元 素 的 下 标 名 为 VMIN 和 VTIME. 
MIN 指定 一 个 read 返回 前 的 最 小 字 节 数 。TIME 指定 等 待 数据 到 达 的 分 秒 数 〈 分 秒 为 秒 的 
l/10)。 有 下 列 4 种 情形 。 
情形 A: MIN>0, TIME>0 
TIME 指定 一 个 字 节 间 定 时 器 Cinterbyte timer)， 它 只 在 第 一 个 字 节 被 接收 时 启动 。 
在 该 定时 器 超时 之 前 ， 若 已 接 到 MIN 个 字 节 ， 则 read 返回 MIN 个 字 节 。 如 果 在 
接 到 MIN 个 字 节 之 前 ， 该 定时 器 已 超时 ， 则 read 返回 已 接收 到 的 字 节 。( 因 为 定 
时 器 是 在 第 一 个 字 节 被 接收 后 启动 的 ， 所 以 在 定时 器 超时 时 ，read 至 少 会 返回 一 
个 字 节 。) 在 这 种 情形 中 ， 第 一 个 字 节 被 接收 之 前 ， 调 用 者 会 一 直 阻 塞 。 如 果 在 调 
用 read 时 数据 已 经 可 用 ， 则 就 如 同 在 read 后 数据 被 立即 接收 了 一 样 。 

情形 B: MIN»0, TIME==0 
read 在 接收 到 MIN 个 字 节 之 前 不 返回 。 这 会 造成 read 无 限期 阻塞 。 

情形 C: MIN=0, TIME>0 
TIME 指定 一 个 调用 read 时 启动 的 读 定时 器 。 与 情形 A 相 比较 ， 两 者 是 不 同 的 。 
在 情形 A 中 ， 非 0 TIME 表示 字 节 间 定时 器 ， 该 定时 器 要 等 到 第 一 个 字 节 被 接收 时 
才 启 动 。) 在 接 到 一 个 字 节 或 者 该 定时 器 超时 时 ，read 即 返回 。 如 果 是 定时 器 超时 ， 
则 read 返回 0. 

情形 D: MIN—0, TIME==0 
如 果 有 数据 可 用 ， 则 reaa 最 多 返回 所 要 求 的 字 节 数 。 如 果 无 数据 可 用 ， 则 reaa 
立即 返回 0。 

在 所 有 这 些 情形 中 ，MIN 只 是 最 小 值 。 如 果 程 序 要 求 的 数据 多 于 MIN 个 字 节 ， 那 么 它 或 许 
能 接收 到 所 要 求 的 字 节 数 。 这 也 适用 于 MIN 一 0 的 情形 C 和 情形 D. 

图 18-19 总 结 并 列 出 了 非 规范 模式 输入 的 4 种 不 同情 形 。 在 这 个 图 中 ，nbytes 是 read 的 第 
三 个 参数 (返回 的 最 大 字 节 数 )。 
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MIN>0 MIN — 0 
A: 在 定时 器 超时 前 ， C: 在 定时 器 超时 前 ， 














read 返回 [MIN, nbytes]; read 返回 [1, nbytes]; 
TIME» 0 如 果 定 时 器 超时 ， 如 果 定 时 器 超时 ， 
read 返回 [1, MIN]。 read 返回 0。 
(TIME= 字 节 间 定时 器 。 (TIME=read 定时 器 。) 
调用 者 会 无 限期 阻塞 。) 
B: 当 有 可 用 数据 时 ， D: read 立即 返回 [0, nbytes]。 
TIME 一 0 read 返回 [MIN, nbytes]. 
(调用 者 可 无 限期 阻塞 。) 








图 18-19 非 规范 输入 的 4 种 情形 


请 注意 ，POSIX.1 允许 下 标 VMIN 和 VTIME 的 值 分 别 与 VEOF 和 VEOL 的 相同 。 确 实 ，Solaris 就 
是 这 样 做 的 ， 这 样 就 提供 了 与 System V 的 早期 版 本 的 兼容 性 。 但 是 ， 这 也 带 来 了 可 移植 性 问题 。 从 非 
规范 模式 转换 为 规范 模式 时 ， 必 须 恢复 VEOF 和 VEOL。 如 果 VMIN 等 于 VEOF， 且 不 恢复 它们 的 值 ， 
那么 当 把 VMIN 的 典型 值 设 置 为 1 时 ， 文 件 结束 符 就 变 成 了 CtrlHA。 解 决 这 一 问题 最 简单 的 方法 是 : 
在 要 转 入 非 规范 模式 时 ， 将 整个 termios 结构 保存 起 来 ， 以 后 再 要 转 回 规范 模式 时 恢复 它 


m KB 


图 18-20 中 的 程序 定义 了 函数 tty cbreak 和 tty_raw， 它 们 将 终端 分 别 设置 为 cbreak 模 
X (cbreak mode) 和 原始 模式 Craw mode). (RE cbreak 和 原始 来 自 于 V7 的 终端 驱动 程序 。) 
tty reset 函数 的 功能 是 将 终端 恢复 到 原始 的 工作 状态 (也 就 是 调用 tty cbreak BK tty raw 
之 前 的 工作 状态 )。 
如 果 已 调用 tty_cbreak， 那 么 在 调用 tty raw 之 前 需要 调用 tty_reset。 如 果 已 调用 
tty_raw， 然 后 又 要 调用 tty_cbreak， 那 么 在 此 之 前 同样 也 要 调用 tty_reset。 这 减少 了 出 
错时 终端 处 于 不 可 用 状态 的 机 会 
该 程序 还 提供 了 另外 两 个 函数 ， tty_atexit 和 tty_termios。tty_atexit 可 被 登记 为 
退出 处 理 程序 ， 以 保证 exit 恢复 终端 工作 模式 。tty_termios 则 返回 一 个 指向 原来 规范 模式 
F termios 结构 的 指针 。 
#include "apue.h" 


#include <termios.h> 
#include <errno.h> 


static struct termios save_termios; 
static int ttysavefd = -1; 
static enum ( RESET, RAW, CBREAK } ttystate - RESET; 
int 
tty cbreak(int fd) /* put terminal into a cbreak mode */ 
{ 
int err; 
struct termios buf; 
if (ttystate != RESET) { 


errno = EINVAL; 
return(-1); 
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} 
if (tcgetattr(fd, &buf) < 0) 
return (-1); 
save_termios = buf; /* structure copy */ 


/* 
* Echo off, canonical mode off. 
a A 
buf.c lflag &= ~(ECHO | ICANON) ; 


/* 

* Case B: 1 byte at a time, no timer. 

“7 

buf.c_cc[VMIN] = 1; 

buf.c_cc[VTIME] = 0; 

if (tcsetattr(fd, TCSAFLUSH, &buf) < 0) 
return (-1); 


/* 


* Verify that the changes stuck. tcsetattr can return 0 on 


* partial success. 
*/ 
if (tcgetattr(fd, &buf) « 0) { 
err - errno; 
tcsetattr(fd, TCSAFLUSH, &save termios); 
errno - err; 
return(-1); 


} 
if ((buf.c_lflag & (ECHO | ICANON)) || buf.c_cc[VMIN] != 


buf.c_cc[VTIME] != 0) { 
/* 
* Only some of the changes were made. Restore the 
* original settings. 
*/ 
tcsetattr(fd, TCSAFLUSH, &save termios); 
errno - EINVAL; 
return(-1); 


ttystate - CBREAK; 
ttysavefd - fd; 
return(0); 


int 
tty raw(int fd) /* put terminal into a raw mode */ 
{ 

int err; 

struct termios buf; 

if (ttystate != RESET) { 


errno = EINVAL; 
return (-1);7 


) 
if (tcgetattr(fd, &buf) < 0) 


18.11 


return (-1); 
save_termios = buf; /* structure copy */ 


/* 

* Echo off, canonical mode off, extended input 
* processing off, signal chars off. 

wf 

buf.c lflag &= ~(ECHO | ICANON | IEXTEN | ISIG); 


/* 

* No SIGINT on BREAK, CR-to-NL off, input parity 

* check off, don't strip 8th bit on input, output 

* flow control off. 

+f 
buf.c_iflag &= ~(BRKINT | ICRNL | INPCK | ISTRIP | IXON); 


/* 

* Clear size bits, parity checking off. 
*/ 

buf.c cflag &= -(CSIZE | PARENB); 


/* 

* Set 8 bits/char. 
xy 

buf.c_cflag |= CS8; 


/* 
* Output processing off. 
*/ 
buf.c oflag &= -(OPOST); 


/* 

* Case B: 1 byte at a time, no timer. 
*/ 

buf.c cc[VMIN] = 1; 

buf.c cc[VTIME] = 0; 


if (tcsetattr(fd, TCSAFLUSH, &buf) < 0) 
return(-1); 


/* 
* Verify that the changes stuck. tcsetattr can return 0 on 
* partial success. 
Ry 
if (tcgetattr (fd, &buf) < 0) { 
err = errno; 
tcsetattr(fd, TCSAFLUSH, &save termios); 
errno - err; 
return(-1); 
) 
if ((buf.c lflag & (ECHO | ICANON | IEXTEN | ISIG)) || 
(buf.c iflag & (BRKINT | ICRNL | INPCK | ISTRIP | IXON)) |] 


(buf.c cflag & (CSIZE | PARENB | CS8)) != CS8 || 
(buf.c oflag & OPOST) || buf.c cc[VMIN] != 1 || 
buf.c cc[VTIME] != 0) { 


/* 


非 规范 模式 
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} 


int 


} 


* Only some of the changes were made. Restore the 
* original settings. 

iad 

tcsetattr(fd, TCSAFLUSH, &save termios); 

errno - EINVAL; 

return(-1); 


ttystate - RAW; 
ttysavefd - fd; 
return(0); 


tty reset(int fd) /* restore terminal's mode */ 


( 


} 


void 


if (ttystate == RESET) 


return (0); 


if (tcsetattr(fd, TCSAFLUSH, &save termios) < 0) 


return(-1); 


ttystate - RESET; 
return(0); 


tty atexit (void) /* can be set up by atexit(tty atexit) */ 


{ 


} 


if (ttysavefd >= 0) 


tty_reset (ttysavefd) ; 


struct termios * 
tty_termios (void) /* let caller see original tty state */ 


{ 


) 


return (&save_termios) ; 


FA 18-20 ”将 终端 模式 设置 为 cbreak 模式 或 原始 模式 


cbreak 模式 的 定义 如 下 。 


非 规范 模式 。 如 本 节 开 始 处 所 述 ， 这 种 模式 关闭 了 对 某 些 输入 字符 的 处 理 。 这 种 模式 没 
有 关闭 对 信和 号 的 处 理 ， 所 以 用 户 始终 可 以 键入 一 个 能 够 触发 终端 产生 信和 号 的 字符 。 请 注 
意 ， 调 用 者 应 当 捕 捉 这 些 信号 ， 和 否则 这 种 信号 就 有 可 能 终止 程序 ， 并 且 使 终端 保持 在 
cbreak 模式 。 

作为 一 般 规 则 ， 在 编写 更 改 终端 模式 的 程序 时 ， 应 当 捕捉 大 多 数 信 和 号， 以便 在 程序 终止 
前 恢复 终端 模式 。 

关闭 回 显 。 

每 次 输入 一 个 字 节 。 为 此 ， 将 MIN 设置 为 1， 将 TIME 设置 为 0。 这 是 图 18-19 中 的 情形 
B。 至 少 有 一 个 字 节 可 用 时 ，read 才 返 回 。 


对 原始 模式 的 定义 如 下 。 


非 规范 模式 。 也 关闭 了 对 信和 号 产生 字符 CISIG) 和 扩充 输入 字符 CIEXTEN) 的 处 理 。 
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另外 还 禁用 了 BRKINT 字符 ， 使 BREAK 字符 不 再 产生 信号 。 

。 关闭 回 显 。 

e 禁止 输入 中 的 CR 到 NL 映射 CICRNIL)、 输 入 奇偶 检测 (INPCK)、 和 剥离 输入 字 节 的 第 8 
位 CISTRIP) 以 及 输出 流 控制 CIXOND. 

。 8 位 字符 (cs8)， 且 禁用 奇偶 校 验 (PARENB)。 

。 禁止 所 有 输出 处 理 (OPOST)。 

。 每 次 输入 一 个 字 节 (MIN=1，TIME=0)。 

图 18-21 中 的 程序 测试 原始 模式 和 cbreak 模式 。 


#include "apue.h" 


static void 

sig_catch(int signo) 

{ 
printf ("signal caught\n") ; 
tty_reset (STDIN_FILENO) ; 
exit (0); 


main (void) 


int iz 

char es 

if (signal(SIGINT, sig catch) -- SIG ERR) /* catch signals */ 
err sys("signal(SIGINT) error"); 

if (signal(SIGQUIT, sig catch) -- SIG ERR) 
err sys("signal(SIGQUIT) error"); 

if (signal(SIGTERM, sig catch) -- SIG ERR) 


err sys("signal(SIGTERM) error"); 


if (tty raw(STDIN FILENO) < 0) 
err sys("tty raw error"); 
printf("Enter raw mode characters, terminate with DELETE\n") ; 
while ((i = read(STDIN FILENO, &c, 1)) == 1) ( 
if ((c &= 255) == 0177) /* 0177 = ASCII DELETE */ 
break; 
printf("£oWMn", c); 
} 
if (tty reset(STDIN FILENO) < 0) 
err sys("tty reset error"); 
if (i <= 0) 
err sys("read error"); 
if (tty cbreak(STDIN FILENO) < 0) 
err sys("tty cbreak error"); 
printf("\nEnter cbreak mode characters, terminate with SIGINT\n"); 
while ((i = read(STDIN FILENO, &c, 1)) == 1) ( 
c &= 255; 
printf ("so\n", c); 
} 
if (tty reset(STDIN FILENO) < 0) 
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err sys("tty reset error"); 
if (ài <= 0) 
err sys("read error"); 


exit(0); 


图 18-21 测试 原始 终端 模式 和 cbreak 终端 模式 
运行 图 18-21 中 的 程序 ， 可 以 观察 这 两 种 终端 工作 模式 的 工作 情况 。 


$ ./a.out 
Enter raw mode characters, terminate with DELETE 


33 
133 
61 
70 
176 

键入 Delete 
Enter cbreak mode characters, terminate with SIGINT 
1 键入 Ctrl+A 
10 键入 退 格 
signal caught 键入 中 断 键 


在 原始 模式 中 ， 输 入 的 字符 是 Ctrl+D〈04) 和 特殊 功能 键 F7。 在 所 用 的 终端 上 ， 此 功能 键 产生 5 
个 字符 : ESC (033). [ (0133)、1 (061). 8 (070) I~ (0176)。 注 意 ， 在 原始 模式 下 关闭 了 输 
出 处 理 〈-OPOST)， 所 以 在 每 个 字符 后 没有 得 到 回 车 符 。 另 外 还 要 注意 的 是 ， 在 cbreak 模式 下 ， 
不 对 输入 特殊 字符 进行 处 理 〈 因 此 没 对 CtrlHD、 文 件 结束 符 和 退 格 进行 特殊 处 理 )， 但 是 仍 对 终 
端 产生 的 信号 进行 处 理 。 = 


18.12 ”终端 窗口 大 小 


大 多 数 UNIX 系统 都 提供 了 一 种 跟踪 当前 终端 窗口 大 小 的 方法 ， 在 窗口 大 小 发 生变 化 时 ， 使 
内 核 通知 前 台 进 程 组 。 内 核 为 每 个 终端 和 伪 终 端 都 维护 了 一 个 winsize 结构 : 


struct winsize { 


unsigned short ws_row; /* rows, in characters */ 
unsigned short ws_col; /* columns, in characters */ 
unsigned short ws_xpixel; /* horizontal size, pixels (unused) */ 
unsigned short ws_ypixel; /* vertical size, pixels (unused) */ 
}; 
此 结构 的 规则 如 下 。 


e 用 ioctl ( 见 3.15 节 ) 的 TIOCGWINSZ 命令 可 以 取 此 结构 的 当前 值 。 

e 用 ioctl 的 TIOCSWINSZ 命令 可 以 将 此 结构 的 新 值 存储 到 内 核 中 。 如 果 此 新 值 与 存储 
在 内 核 中 的 当前 值 不 同 ， 则 前 台 进 程 组 会 收 到 SIGWINCH 信号 。( 注 意 ， 从 图 10-1 中 可 
以 看 出 ， 此 信和 号 的 系统 默认 动作 是 被 忽略 。) 

。 除了 存储 此 结构 的 当前 值 以 及 在 此 值 改 变 时 产生 一 个 信号 以 外 ， 内 核对 该 结构 不 进行 任 
何其 他 操作 。 对 结构 中 的 值 进行 解释 完全 是 应 用 程序 的 工作 。 

提供 这 种 功能 的 目的 是 ， 当 窗口 大 小 发 生变 化 时 应 用 程序 能 够 得 到 通知 (如 vi 编辑 器 )。 应 
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用 程序 接收 此 信号 后 ， 可 以 获取 窗口 大 小 的 新 值 ， 然 后 重 绘 屏幕 。 


m XA 


图 18-22 所 示 的 程序 打印 当前 窗口 大 小 ， 然 后 休眠 。 每 次 窗口 大 小 改变 时 ， 程 序 就 捕捉 到 
SIGWINCH 信号 ， 然 后 打印 新 的 窗口 大 小 。 我 们 必须 用 一 个 信号 终止 此 程序 。 


#include "apue.h" 
#include <termios.h> 
#ifndef TIOCGWINSZ 
#include <sys/ioctl.h> 
#Hendif 


static void 
pr_winsize(int fd) 
{ 


struct winsize size; 


if (ioctl(fd, TIOCGWINSZ, (char *) &size) < 0) 
err Sys("TIOCGWINSZ error"); 
printf("%d rows, $d columns Mn", size.ws row, size.ws col); 


static void 

sig winch(int signo) 

{ 
printf ("SIGWINCH received\n") ; 
pr winsize(STDIN FILENO); 


int 
main (void) 


{ 


if (isatty(STDIN FILENO) == 0) 
exit(1); 
if (signal(SIGWINCH, sig winch) -- SIG ERR) 
err sys("signal error"); 
pr winsize(STDIN FILENO); /* print initial size */ 
for (€ » 2) /* and sleep forever */ 
pause(); 


图 18-22 打印 窗口 大 小 
在 一 个 带 窗口 终端 的 系统 上 运行 图 18-22 中 的 程序 得 到 : 


$ ./a.out 

35 rows, 80 columns 初始 大 小 

SIGWINCH received 更 改 窗口 大 小 : 捕 提 到 信号 
40 rows, 123 columns 

SIGWINCH received 再 一 次 


42 rows, 33 columns 


^G S 键入 中 断 键 以 终止 
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18.13 termcap, terminfo ffl curses 


termcap 的 意思 是 终端 能 力 (terminal capability), EW RAKE /etc/termcap 和 
一 套 读 此 文件 的 例 程 。termcap 这 种 技术 是 在 伯克利 开发 的 ， 注 意 是 为 了 支持 vi 编辑 器 。 
termcap 文件 包含 了 对 各 种 终端 的 说 明 : 终端 支持 哪些 功能 〈 如 行 数 、 列 数 、 终 端 是 否 支持 
退 格 )， 如 何 使 终端 执行 某 些 操 作 (如 清 屏 、 将 光标 移动 到 给 定位 置 )。 把 这 些 信息 从 编译 过 
的 程序 中 取出 来 并 把 它们 放 在 易于 编辑 的 文本 文件 中 , 这 样 就 使 得 vi 编辑 器 能 在 很 多 不 同 的 
终端 上 运行 。 

最 后 ， 将 支持 termcap 文件 的 例 程 从 vi 编辑 器 中 抽取 出 来 ， 放 在 一 个 单独 的 curses FE 
中 。 为 使 这 套 库 可 供 要 进行 屏幕 处 理 的 任何 程序 使 用 ， 还 增加 了 很 多 功能 。 

termcap 这 种 技术 并 不 是 很 完善 。 当 越 来 越 多 的 终端 被 加 到 数据 文件 中 时 , 为 找到 一 个 特定 
的 终端 ， 需 要 花费 更 长 的 时 间 扫 描 此 数据 文件 。 这 个 数据 文件 还 用 两 个 字符 的 名 字 来 标识 不 同 的 
终端 属性 。 这 些 缺陷 迫使 开发 人 员 开 发 出 了 terminfo 以 及 与 其 相关 的 curses FE. TE terminfo 
中 ， 终 端 说 明基 本 上 都 是 文本 说 明 的 编译 版 本 ， 在 运行 时 易于 被 快速 定位 。terminfo 最 初 由 
SVR2 开始 使 用 ， 此 后 所 有 System V 的 版 本 都 使 用 它 。 


历史 上 , 基于 System V 的 系统 使 用 terminfo，BSD 派生 的 系统 使 用 termcap， 但 是 现在 ， 
系统 通常 两 者 都 提供 。 然 而 Mac OS X 仅 支 持 terminfo。 


Goodheart[1991] 对 terminfo 和 curses 库 进行 了 详细 说 明 , 但 此 书 已 不 再 增 印 ,Strang[1986] 
说 明了 curses 函数 库 的 伯克利 版 本 。 Strang. Mui 和 O’Reilly[1988] Xt termcap 和 terminfo 
进行 了 说 明 。 

可 在 http://invisible-island.net/ncurses/ncurses.html X http://www.gnu. 
org/software/ncurses 上 找到 与 SVR4 curses 接口 兼容 的 开放 版 ncurses 函数 库 。 


不 论 是 termcap 还 是 terminfo， 它 们 本 身 都 不 处 理 本 章 所 述 及 的 问题 : 更 改 终端 的 模 
式 、 更 改 终端 特殊 字符 、 处 理 窗口 大 小 等 。 它 们 所 提供 的 是 在 各 种 终端 上 执行 典型 操作 〈 清 屏 、 
移动 光标 ) 的 方法 。 另 一 方面 ， 在 本 章 所 述 问题 方面 ，curses 能 提供 某 种 具体 细节 方面 的 帮 
Ih. curses 提供 了 很 多 函数 ， 用 来 设置 原始 模式 、 设 置 cbreak 模式 、 打 开 和 关闭 回 显 等 。 注 
意 ，curses 库 是 为 基于 字符 的 哑 终 端 设计 的 ， 而 如 今 ， 它 们 大 部 分 已 被 以 基于 像素 的 图 形 终 
端 所 代替 。 


18.14 小结 


终端 有 很 多 特征 和 选项 ， 其 中 大 多 数 都 可 按 需 进行 更 改 。 本 章 描述 了 很 多 更 改 终 端 操 作 〈 即 
更 改 特殊 输入 字符 和 可 选择 标志 ) 的 函数 ， 还 介绍 了 可 对 终端 设备 进行 设置 或 恢复 的 各 个 终端 特 
殊 字 符 以 及 众多 选项 。 

终端 的 输入 模式 有 两 种 一 一 规范 的 〈 每 次 一 行 ) 和 非 规范 的 。 本 章 中 包含 了 若干 这 两 种 工作 
模式 的 实例 ， 也 提供 了 一 些 函 数 ， 它 们 在 POSIX.1 终端 选项 和 较 早 的 BSD cbreak 模式 及 原始 模 
式 之 间 进 行 映 射 。 本 章 还 说 明了 如 何 获取 和 改变 终端 窗口 大 小 。 


习题 579 


习题 


18.1 编写 一 个 调用 tty raw 并 且 不 恢复 终端 模式 就 终止 的 程序 。 如 果 系 统 提 供 reset(1) 命 令 
(本 书 说 明 的 4 种 平台 全 都 提供 )， 使 用 该 命令 恢复 终端 模式 。 
182 c cflag 字段 的 PARODD 标志 允许 我 们 设置 奇 检验 或 偶 校 验 ， 而 BSD 中 的 tip 程序 也 允 
许 奇 偶 校 验 位 为 0 或 1。 它 是 如 何 实现 的 ? 
18.3 如 果 你 系统 中 的 stty(1) 命 令 输出 MIN 和 TIME 值 ， 做 下 面 的 练习 。 登 录 系 统 两 次 ， 其 中 
一 次 登录 时 打开 vi 编辑 器 ， 在 另外 一 次 登录 中 用 stty 命令 确定 vi 设置 的 MIN fil TIME 
值 (因为 vi 将 终端 设置 为 非 规范 模式 )。( 如 果 你 的 终端 上 有 窗口 系统 正在 运行 ， 那 么 你 也 
可 以 进行 同样 的 测试 ， 方 法 是 : 登录 一 次 ， 然 后 用 两 个 分 开 的 窗口 。) 713 


相关 进程 的 典型 安排 。 图 中 的 关键 点 如 下 。 
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19.1 引言 


在 第 9 章 中 ， 我 们 了 解 到 ， 终 端 登录 是 经 由 自动 提供 终端 语义 的 终端 设备 进行 的 。 在 终端 和 运行 
程序 之 间 有 一 个 终端 行规 程 ( 见 图 18-2)， 通 过 该 规程 我 们 能 够 设置 终端 的 特殊 字符 〈 如 退 格 、 行 删 
除 、 中 断 等 )。 但 是 ， 当 一 个 登录 请 求 到 达 网 络 连接 时 ， 终 端 行规 程 并 不 是 自动 被 加 载 到 网 络 连接 和 
登录 shell 之 间 的 。 图 9-5 显示 了 一 个 伪 终 端 (pseudo terminal) 设备 驱动 程序 ， 用 于 提供 终端 语义 。 

伪 终 端 除 了 用 于 网 络 登 录 ， 还 有 其 他 用 途 ， 本 章 将 对 此 进行 介绍 。 首 先 概要 叙述 如 何 使 用 伪 
终端 ， 接 着 讨论 某 些 特殊 使 用 情况 。 然 后 ， 提 供 在 多 种 平台 下 用 于 创建 伪 终 端的 函数 ， 并 使 用 这 
些 函 数 编写 一 个 程序 ， 我 们 将 该 程序 称 为 pty。 将 看 到 pty 程序 的 各 种 用 途 : 抄录 在 终端 上 输入 
和 输出 的 所 有 字符 (script(1) 程 序 ); 运行 协同 进程 来 避免 图 15-19 中 的 程序 遇 到 的 缓冲 区 问题 。 


19.2 概述 


伪 终 端 这 个 术语 是 指 ， 对 于 一 个 应 用 程序 而 言 ， 它 看 上 去 像 一 个 终端 ， 但 事实 上 它 并 不 是 一 
个 真正 的 终端 。 图 19-1 显示 了 使 用 伪 终 端 时 ， 


。 通常 ， 一 个 进程 打开 伪 终端 主 设备 ， 然 
后 调用 fork。 子 进程 建立 一 个 新 的 会 
话 ， 打 开 一 个 相应 的 伪 终 端 从 设备 ， 将 ， 
其 文件 描述 符 复制 到 标准 输入 、 标 准 输 
出 和 标准 错误 ， 然 后 调用 exec。 伪 终端 
从 设备 成 为 子 进程 的 控制 终端 。 

。 对 于 伪 终 端 从 设备 上 的 用 户 进程 来 说 ， 
其 标准 输入 、 标 准 输出 和 标准 错误 都 是 
终端 设备 。 通 过 这 些 描述 符 ， 用 户 进程 
能 够 处 理 第 18 章 中 的 所 有 终端 IO K 
数 。 但 是 因为 伪 终 端 从 设备 不 是 真正 的 
终端 设备 ， 所 以 无 意义 的 函数 调用 例 
如 ， 改 变 波 特 率 、 发 送 中 断 符 、 设 置 奇 上 
偶 校 验 ) 将 被 忽略 。 图 19-1 使 用 伪 终 端的 相关 进程 的 典型 结构 











。 任何 写 到 伪 终 端 主 设备 的 都 会 作为 从 设备 的 输入 ， 反 之 亦 然 。 事 实 上 ， 所 有 从 设备 端的 


输入 都 来 自 于 伪 终 端 主 设备 上 的 用 户 
进程 。 这 看 起 来 就 像 一 个 双向 管道 , 但 
从 设备 上 的 终端 行规 程 使 我 们 拥有 普 
通 管道 没有 的 其 他 处 理 能 力 。 

图 19-1 显示 了 FreeBSD. Mac OSX 或 Linux 
系统 中 的 伪 终 端 结构 。19.3 节 将 介绍 如 何 打开 
这 些 设备 。 

在 Solaris "P, 伪 终 端 是 使 用 STREAMS F 
系统 构建 的 〈 见 14.4 节 )。 图 19-2 详细 描述 了 
Solaris 中 各 个 伪 终 端 STREAMS 模块 的 安排 。 
虚线 框 中 的 两 个 STREAMS 模块 是 可 选 的 。 
pckt 和 ptem 模块 帮助 提供 伪 终 端 特有 的 语 
义 。 另 外 两 个 模块 (ldterm 和 ttcompat) 
提供 行规 程 处 理 。19.3 节 将 展示 如 何 建立 这 些 
STREAMS 模块 的 安排 。 

现在 简化 以 上 图 示 ， 不 再 画 出 图 19-1 中 的 
“TPA RAS PAR” RE 19-2 中 的 “ 流 首 ”。 同 
时 使 用 缩写 “PTY” 表 示 伪 终端 ， 并 将 图 19-2 
中 所 有 伪 终 端 从 设备 之 上 的 STREAMS 模块 
合并 在 一 起 表示 为 “终端 行规 程 ” 模 块 ， 像 
图 19-1 中 的 那样 。 

现在 , 我 们 来 考察 伪 终 端的 某 些 典型 用 途 。 

1. 网 络 登 录 服 务 器 
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图 19-2 Solaris 中 的 伪 终 端 安排 


伪 终 端 可 用 于 构造 提供 网 络 登 录 的 服务 器 。 典 型 的 例子 是 telneta 和 rlogind 服务 器 。 


Stevens[1990] 中 的 第 15 章 详 细 讨 论 了 提供 rlogin 服务 的 步骤 。 一 旦 登录 shell 运行 在 远 端 主机 


上 ， 即 可 得 到 图 19-3 中 所 示 的 安排 。telnetq 服务 器 使 用 类 似 的 安排 。 


在 rlogind 服务 器 和 登录 shell 之 间 有 两 个 exec 调用 ， 这 是 因为 login 程序 通常 是 在 两 


个 exec 之 间 检 验 用 户 是 否 合法 。 


图 19-3 的 一 个 关键 点 是 ， 驱 动 PTY 主 设备 的 进程 通常 同时 在 读 写 另 一 个 VO 流 。 本 例 中 另 


一 个 IO Hike TCP/IP 框 。 这 表示 该 进程 必然 使 用 了 某 种 形式 的 诸如 select BK poll 这 样 的 IO 


多 路 转 接 ( 见 14.4 节 )， 或 者 被 分 成 两 个 进程 或 线程 。 


2. 窗口 系统 终端 模拟 


窗口 系统 通常 提供 一 个 终端 模拟 器 ， 这 样 我 们 就 能 在 熟悉 的 命令 行 环境 中 通过 shell 来 运行 程 
序 。 终 端 模拟 器 作为 shell 和 窗口 管理 器 之 间 的 媒介 。 每 个 shell 在 自己 的 窗口 中 执行 。 这 个 安排 


(两 个 shell 运行 在 不 同窗 口 ) 如 图 19-4 所 示 。 


shell 将 自己 的 标准 输入 、 标 准 输 出 、 标 准 错误 连接 到 PTY 的 从 设备 端 。 终端 模拟 器 程序 打 
JF PTY 的 主 设 备 。 终 端 模拟 器 除了 作为 窗口 子 系统 的 接口 ， 还 要 负责 模拟 一 种 特殊 的 终端 ， 这 
意味 着 它 需 要 根据 它 所 模拟 的 设备 类 型 来 响应 返回 码 。 这 些 码 列 在 termcap 和 terminfo 数据 


库 中 。 
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图 19-4 ”窗口 系统 的 进程 安排 

当 用 户 改变 终端 模拟 器 窗口 的 大 小 时 , 窗口 管理 器 会 通知 终端 模拟 器 。 终端 模 拟 器 在 PTY 的 

主 设备 端 发 出 TIOCSWINSZ ioctl 命令 来 设置 从 设备 的 窗口 大 小 。 如 果 新 的 窗口 大 小 和 当前 的 
不 同 ， 内 核 会 发 送 一 个 SIGWINCH 信号 给 前 台 PTY 从 设备 的 进程 组 。 如 果 应 用 程序 在 窗口 大 小 

改变 时 需要 重 绘 屏 幕 ， 它 就 会 捕捉 这 个 SIGWINCH 信号 ， 然 后 发 出 TIOCSWINSZ ioctl 命令 获 
得 新 的 屏幕 尺寸 并 重 绘 屏幕 。 

3. script 程序 

script(1) 程 序 是 随 大 多 数 UNIX 系统 提供 的 ， 它 将 终端 会 话 期 间 的 所 有 输入 和 输出 信息 复 
制 到 一 个 文件 中 。 为 完成 此 工作 , 该 程序 将 自己 置 于 终端 和 一 个 新 调用 的 登录 shell 之 间 。 图 19-5 
详细 描述 了 script 程序 有 关 的 交互 。 这 里 要 特别 指出 ，script 程序 通常 是 从 登录 shell 启动 的 ， 
该 shell 还 要 等 待 script 程序 的 终止 。 
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图 19-5 script 程序 
script 程序 运行 时 ， 位 于 PTY 从 设备 上 的 终端 行规 程 的 所 有 输出 都 将 复制 到 脚本 文件 中 
(通常 称 为 typescript)。 因 为 击 键 通常 由 该 行规 程 模块 回 显 ， 所 以 该 脚本 文件 也 包括 了 输入 的 
内 容 。 但 是 ， 因 为 键入 的 口令 不 会 回 显 ， 所 以 该 脚本 文件 不 会 包含 口令 。 


在 编写 本 书 第 1 版 时 ，Rich Stevens 用 script 程序 获取 实例 程序 的 输出 。 这 样 避免 了 手工 复 
制程 序 输出 可 能 带 来 的 错误 。 但 是 ， 使 用 script 的 不 足 之 处 是 必须 处 理 脚 本 文件 中 的 控制 字符 。 


在 19.5 节 开 发 了 通用 的 pty 程序 后 , 我 们 将 看 到 使 用 pty 程序 和 一 个 简单 的 shell 脚本 就 能 
够 实现 一 个 新 版 本 的 script 程序 。 

4. expect 程序 

伪 终 端 可 以 用 来 在 非 交互 模式 中 驱动 交互 式 程序 的 运行 。 许 多 硬 连 线程 序 需要 一 个 终端 才能 
运行 ，passwd(1) 命 令 就 是 一 个 例子 ， 它 要 求 用 户 在 系统 提示 后 输入 口令 。 

为 了 支持 批 处 理 操作 模式 而 修改 所 有 交互 式 程序 是 非常 麻烦 的 ， 与 这 种 处 理 相 比 ， 一 个 更 好 
的 解决 方法 是 通过 一 个 脚本 来 驱动 交互 式 程序 。expect 程序 [Libes 1990, 1991, 1994] 提 供 了 这 样 
的 方法 。 类 似 于 19.5 节 的 pty 程序 ， 它 使 用 伪 终 端 来 运行 其 他 程序 。 并 且 ，expect 还 提供 了 一 
种 编程 语言 用 于 检查 运行 程序 的 输出 ， 以 确定 用 什么 作为 输入 发 送 给 该 程序 。 当 一 个 源 自 脚 本 的 
交互 式 的 程序 正在 运行 时 ， 不 能 仅仅 是 将 脚本 中 的 所 有 内 容 复制 到 程序 中 去 ， 或 者 将 程序 的 输出 
送 至 脚本 ， 而 是 必须 要 向 程序 发 送 某 个 输入 ， 检 查 它 的 输出 ， 并 决定 下 一 步 发 送 给 程序 的 内 容 。 

5. 运行 协同 进程 

在 图 15-19 所 示 的 协同 进程 的 例子 中 , 我 们 不 能 调用 使 用 标准 IO 库 进 行 输入 、 输出 的 协同 进程 ， 
这 是 因为 当 通过 管道 与 协同 进程 进行 通信 时 ， 标 准 IO 库 会 完全 缓冲 标准 输入 和 标准 输出 ， 从 而 引起 
死 锁 。 如 果 协 同 进 程 是 一 个 已 经 编译 的 程序 而 我 们 又 没有 源 程序 ， 则 无 法 在 源 程序 中 加 入 £ flush 语 
铝 来 解决 这 个 问题 。 图 15-16 显示 了 一 个 进程 驱动 协同 进程 的 情况 。 我 们 需要 做 的 是 将 一 个 伪 终 端 放 
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到 两 个 进程 之 间 〈 如 图 19-6 所 示 )， 诱 使 协同 进程 认为 它 是 由 终端 驱动 的 ， 而 非 另 一 个 进程 。 
协同 进程 


管道 1 stdin 
w- | | ee | 
stdout 
管道 2 


图 19-6 ”用 伪 终 端 驱动 一 个 协同 进程 
现在 协同 进程 的 标准 输入 和 标准 输出 就 像 终 端 设备 一 样 ， 所 以 标准 IO 库 会 将 这 两 个 流 设置 
成 行 缓冲 。 
父 进程 有 两 种 方法 在 自身 和 协同 进程 之 间 获 得 伪 终 端 , (这 种 情况 下 的 父 进程 可 以 类 似 
图 15-18 中 的 程序 ,使 用 两 个 管道 和 协同 进程 进行 通信 。) 一 个 方法 是 , 父 进 程 直接 调用 pty_fork 
函数 〈 见 19.4 节 ) 而 不 是 调用 fork。 另 一 种 方法 是 ，exec 该 pty 程序 (A 19.5 节 )， 将 协同 
进程 作为 参数 。 我 们 将 在 给 出 pty 程序 后 介绍 这 两 种 方法 。 
6. 观看 长 时 间 运 行程 序 的 输出 
使 用 任何 一 个 标准 shell， 可 以 将 一 个 需要 长 时 间 运 行 的 程序 放 到 后 台 运 行 。 但 是 ， 如 果 将 该 
程序 的 标准 输出 重 定向 到 一 个 文件 ， 并 且 它 产生 的 输出 又 不 多 ， 那 么 我 们 就 不 能 方便 地 监控 程序 
的 进展 ， 因 为 标准 VO 库 将 完全 缓冲 它 的 标准 输出 。 我 们 看 到 的 将 只 是 标准 IO 库 函 数 写 到 输出 
文件 中 的 成 块 输出 ， 有 时 甚至 可 能 是 长 度 为 8 192 字 节 的 数据 块 。 
如 果 有 源 程序 , 则 可 以 加 入 Eflush 调用 强制 标准 VO 缓冲 区 在 某 些 节点 冲洗 或 者 把 缓冲 模式 改 
成 使 用 setvbuf 的 行 缓冲 。 然 而 ， 如 果 没 有 源 程 序 ， 可 以 在 pty 程序 下 运行 该 程序 ， 让 标准 IO 库 
认为 标准 输出 是 终端 。 图 19-7 显示 了 这 个 安排 ,我 们 将 这 个 缓慢 输出 的 程序 称 为 slowout。 从 登录 
shell 到 pty 进程 的 fort/exec 箭头 是 用 虚线 表示 的 ,为 的 是 强调 pty 进程 是 作为 后 台 任 务 运行 的 。 











图 19-7 使 用 伪 终 端 运行 一 个 缓慢 输出 的 程序 
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19.3 ”打开 伪 终 端 设备 


PTY 表现 得 就 像 物 理 终端 设备 一 样 ， 因 此 应 用 程序 就 无 须 在 意 它 们 在 使 用 的 是 何 种 设备 。 然 
而 ， 在 打开 PTY 设备 文件 时 ， 应 用 程序 并 不 需要 设置 0_ TTY INIT iH. Single UNIX Specification 
已 经 要 求 PTY 从 设备 端 第 一 次 被 打开 的 时 候 要 初始 化 ， 这 样 该 设备 正常 工作 所 需要 的 所 有 非 标准 
termios 标识 就 都 被 设置 了 。 这 个 要 求 旨 在 允许 PTY 设备 和 遵循 POSIX 的 调用 tcgetattr 和 
tcsetattz 的 应 用 程序 正确 地 运行 。 

各 种 平台 打开 伪 终 端 设备 的 方法 有 所 不 同 。 在 Single UNIX Specification 的 XSI 扩展 中 包含 了 
很 多 函数 ， 试 图 统一 这 些 方法 。 这 些 函数 的 基础 是 SVR4 用 于 管理 基于 STREAMS 的 伪 终 端的 一 
组 函数 。posix_openpt 函数 提供 了 一 种 可 移植 的 方法 来 打开 下 一 个 可 用 伪 终 端 主 设备 。 


#include <stdlib.h> 


#include «fcntl.h» 


int posix_openpt (int oflag) ; 





返回 值 : 若 成 功 ， 返 回 下 一 个 可 用 的 PTY 主 设备 文件 描述 符 ， 若 出 错 ， 返 回 -1 | |722 


BR oflag 是 一 个 位 屏蔽 字 ， 指 定 如 何 打开 主 设备 ， 它 类 似 于 open(2) 的 oflag 参数 ， 但 是 并 
不 支持 所 有 打开 标志 。 对 于 posix_openpt， 可 以 指定 O_RDWR 来 打开 主 设备 进行 读 、 写 ， 指 定 
O_NOCTTY 来 防止 主 设备 成 为 调用 者 的 控制 终端 。 其 他 打开 标志 都 会 导致 未 定义 的 行为 。 

在 伪 终 端 从 设备 可 用 之 前 ， 它 的 权限 必须 设置 ， 以 便 应 用 程序 可 以 访问 它 。grantpt 函数 提 
供 这 样 的 功能 : 它 把 从 设备 节点 的 用 户 ID 设置 为 调用 者 的 实际 用 户 DD， 设 置 其 组 ID 为 一 非 指定 
值 , 通常 是 可 以 访问 该 终端 设备 的 组 。 权 限 被 设置 为 : 对 个 体 所 有 者 是 读 / 写 , 对 组 所 有 者 是 写 (0620 )。 

实现 通常 将 PTY 从 设备 的 组 所 有 者 设置 为 tty 组 。 把 那些 要 对 系统 中 所 有 活动 终端 具有 写 
权限 的 程序 (如 wal1(1) 和 write(1)) 的 设置 组 ID 设置 为 tty 组 。 因 为 在 PTY 从 设备 上 tty 
组 的 写 权 限 是 被 允许 的 ， 所 以 这 些 程序 就 可 以 向 活动 终端 写 入 。 


#include <stdlib.h> 


int grantpt (int fd); 


int unlockpt (int fd); 





为 了 更 改 从 设备 节点 的 权限 ，grantpt 可 能 需要 fork 并 exec 一 个 设置 用 户 ID 程序 〈 如 
在 Solaris 中 是 /usr/1ib/pt_chmod)。 于 是 ， 如 果 调 用 者 捕捉 到 SIGCHLD 信和 号， 那么 其 行为 
是 未 说 明 的 。 

unlockpt 函数 用 于 准予 对 伪 终 端 从 设备 的 访问 ， 从 而 允许 应 用 程序 打开 该 设备 。 阻 止 
其 他 进程 打开 从 设备 后 ， 建 立 该 设备 的 应 用 程序 有 机 会 在 使 用 主 、 从 设备 之 前 正确 地 初始 化 
这 些 设备 。 

注意 ， 在 grantpt 和 unlockpt 这 两 个 函数 中 ， 文 件 描述 符 参 数 是 与 伪 终 端 主 设备 关联 的 
文件 描述 符 。 

如 果 给 定 了 伪 终 端 主 设备 的 文件 描述 符 ， 那 么 可 以 用 ptsname 函数 找到 伪 终 端 从 设备 的 路 
径 名 。 这 使 应 用 程序 可 以 独立 于 给 定 平台 的 某 种 特定 约定 而 标识 从 设备 。 注 意 ， 该 函数 返回 的 名 
字 可 能 存储 在 静态 存储 中 ， 因 此 后 续 的 调用 可 能 会 覆盖 它 。 
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#include <stdlib.h> 


char *ptsname(int fd); 





返回 值 : 若 成 功 ， 返 回 指向 PTY 从 设备 名 的 指针 ; 若 出 错 ， 返 回 NULL 
or 图 19-8 总 结 了 Single UNIX Specification 中 的 擅 终 端 函数 ， 指 出 了 本 书 讨论 的 4 种 平台 分 别 
支持 哪些 函数 。 


FreeBSD Linux MacOS Solaris 
3.2.0 X 10.6.8 


grantpt 更 改 PTY 从 设备 的 权限 
posix_openpt | 打开 一 个 PTY 主 设备 
Ptsname 返回 PTY 从 设备 的 名 字 
unlockpt 允许 打开 PTY 从 设备 
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Æ FreeBSD 中 ，grantpt fe unlockpt 除了 参数 验证 外 不 执行 任何 操作 ，PTY 是 通过 正确 的 权限 
动态 地 创建 出 来 的 。 注 意 ，FreeBSD 定义 O_NOCTTY 标志 只 是 为 了 兼容 调用 posix_openpt 的 应 用 程 
序 。 在 FreeBSD 中 打开 终端 设备 并 不 会 引起 分 配 控制 终端 的 副作用 ， 所 以 O_NOCTTY 标志 并 无 作用 。 
Single UNIX Specification 已 经 改善 了 此 方面 的 可 移植 性 ， 但 是 差距 仍然 存在 。 我 们 提供 了 两 
个 处 理 所 有 这 些 细节 的 函数 : ptym open 和 ptys_open. ptym_open 打开 下 一 个 可 用 的 PTY 
主 设备 ，ptys_open 打开 相应 的 从 设备 。 
#include "apue.h" 


int ptym open(char *pts name, int pts namesz); 


返回 值 : 若 成 功 ， 返 回 PTY 主 设备 文件 描述 符 ;， 若 出 错 ， 返 回 -1 


int ptys open(char *pts name); 





返回 值 : 若 成 功 ， 返 回 PTY 从 设备 文件 描述 符 ， 若 出 错 ， 返 回 -1 


通常 ， 不 直接 调用 这 两 个 函数 ， 而 是 由 函数 pty fork (X. 19.4 节 ) 调用 它们 ， 并 且 还 会 
fork 出 一 个 子 进程 。 

ptym_open 函数 打开 下 一 个 可 用 的 PTY 主 设备 。 调 用 者 必须 分 配 一 个 数组 来 存放 主 设备 或 
从 设备 的 名 字 ， 并 且 如 果 调 用 成 功 ， 相 应 的 从 设备 名 会 通过 prs: name 返回 。 然 后 ， 这 个 名 字 传 给 
用 来 打开 该 从 设备 的 ptys open 函数 。 缓 冲 区 的 字 节 长 度 由 pts. namesz 传送 ， 使 得 ptym_open 
函数 不 会 复制 比 该 缓冲 区 长 的 字符 串 。 

在 说 明 pty_fork 函数 之 后 ， 提 供 两 个 函数 来 打开 这 两 个 设备 的 原因 将 会 很 明显 。 通 常 ， 一 
个 进程 调用 ptym_open 来 打开 一 个 主 设备 并 且 得 到 从 设备 名 。 该 进程 然后 fork 子 进 程 ， 子 进 
程 在 调用 setsid 建立 新 的 会 话 后 调用 ptys open 打开 从 设备 。 这 就 是 从 设备 如 何 成 为 子 进程 
控制 终端 的 过 程 〈 见 图 19-9). 
#include "apue.h" 
#include <errno.h> 
#include <fcntl.h> 
#if defined (SOLARIS) 


KEV <stropts.h> 
fendif 


int 
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ptym_open(char *pts_name, int pts_namesz) 


{ 
char *ptr; 
int fdm, err; 


if ((fdm = posix openpt(O RDWR)) < 0) 


return(-1); 

if (grantpt(fdm) « 0) 
goto errout; 

if (unlockpt(fdm) « 0) 
goto errout; 


/* grant access to slave */ 


/* clear slave's lock flag */ 


if ((ptr = ptsname(fdm)) == NULL) /* get slave's name */ 


goto errout; 


/* 


* Return name of slave. Null terminate to handle 


* case where strlen(ptr) 


*/ 


» pts namesz. 


strncpy(pts name, ptr, pts namesz); 


pts name[pts namesz - 1] - 
return(fdm); 
errout: 
err = errno; 
close (fdm) ; 
errno = err; 
return (-1); 


int 
ptys_open(char *pts_name) 
{ 

int fds; 
dif defined (SOLARIS) 

int err, setup; 
#endif 


if ((fds = open(pts_name, 
return(-1); 


dif defined (SOLARIS) 
/* 


"NO 
/* return fd of master */ 


O_RDWR)) < 0) 


* Check if stream is already set up by autopush facility. 


x 


if ((setup = ioctl(fds, I FIND, "ldterm")) < 0) 


goto errout; 


if (setup == 0) { 

if (ioctl(fds, I PUSH, 
goto errout; 

if (ioctl(fds, I PUSH, 
goto errout; 

if (ioctl(fds, I, PUSH, 

errout: 

err = errno; 


"ptem") < 0) 
"ldterm") < 0) 


"ttcompat") « 0) ( 
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close (fds); 
errno = err; 
return (-1); 


} 
#tendif 

return (fds); 
} 


19-9. 伪 终 端 打开 函数 

ptym open 函数 用 XSI PTY 函数 找到 并 打开 一 个 未 被 使 用 的 PTY ERE, 并 初始 化 对 应 的 
PTY 从 设备 。ptys_open 函数 打开 的 是 PTY 从 设备 。 然 而 在 Solaris 系统 中 ， 在 PTY 从 设备 表 
现 得 像 个 终端 前 ， 我 们 可 能 需要 多 做 几 步 工作 。 

在 Solaris 中 ,打开 从 设备 后 ,我 们 可 能 需要 将 3 个 STREAMS 模块 压 入 从 设备 的 流 中 。 伪 终 
端 仿真 模块 (ptem) 和 终端 行规 程 模块 (ldterm) 合 在 一 起 像 一 个 真正 的 终端 一 样 工作 。 
ttcompat 提供 了 对 早期 系统 (如 V7、4BSD 和 Xenix) 的 ioctl 调用 的 兼容 性 。 这 是 一 个 可 选 
的 模块 ， 但 是 因为 对 于 网 络 登 录 ， 它 是 自动 压 入 的 ， 所 以 我 们 将 它 压 入 到 从 设备 的 流 中 。 

也 可 能 并 不 需要 压 入 这 3 个 模块 ， 其 原因 是 ， 它 们 可 能 已 经 位 于 流 中 。STREAMS 系统 支持 
一 种 称 为 autopush (自动 压 入 ) 的 工具 ， 它 允许 系统 管理 员 配 置 一 张 模块 列表 ， 只 要 打开 一 个 特 
定 设 备 ， 就 将 这 些 模块 压 入 流 中 〔〈 详 见 Rago[1993])。 使 用 I FIND ioctl 命令 观察 ldterm 是 
否 已 在 流 中 。 如 果 是 ， 则 认为 该 流 已 用 autopush 机 制 配 置 ， 这 样 就 无 需 再 压 入 相应 模块 。 

Linux. Mac OS X 和 Solaris 都 遵循 历史 上 System V 的 行为 : 如 果 调 用 者 是 一 个 还 没有 控制 
终端 的 会 话 首 进程 ， 这 个 打开 Copen) 的 调用 会 分 配 一 个 PTY 从 设备 作为 控制 终端 。 如 果 不 想 
让 这 种 情况 发 生 ， 可 以 在 打开 Copen) 时 设置 0 NocTTY 标志 。 然 而 ， 在 FreeBSD 中 ， 打 开 PTY 
从 设备 不 会 产生 分 配 其 作为 控制 终端 的 副作用 ， 下 一 节 将 探讨 如 何在 FreeBSD 中 分 配 控制 终端 。 


19.4 PAR pty fork 


现在 使 用 上 一 节 介 绍 的 两 个 函数 ptym_open 和 ptys open 来 编写 一 个 新 函数 ， 我 们 称 之 
为 pty_fork。 这 个 新 函数 具有 如 下 功能 : 用 fork 调用 打开 主 设备 和 从 设备 ， 创 建 作为 会 话 首 
进程 的 子 进 程 并 使 其 具有 控制 终端 。 


#include "apue.h" 


#include <termios.h> 


pid t pty fork(int *ptrfdm, char *slave name, int slave namesz, 


const struct termios *s/ave termios, 
const struct winsize *slave winsize) ; 


返回 值 : 子 进程 中 返回 0， 父 进程 中 返回 子 进 程 的 进程 ID; 若 出 错 ， 返 回 -! 
PTY 主 设备 的 文件 描述 符 通过 ptrfdm 指针 返回 。 
如 果 slave name 不 为 空 ， 从 设备 名 被 存储 在 该 指针 指向 的 存储 区 中 。 调 用 者 必须 为 该 存储 区 
分 配 空间 。 
如 果 指 针 slave_termios 不 为 空 ， 则 系统 使 用 该 指针 所 引用 的 结构 初始 化 从 设备 的 终端 行规 程 。 
如 果 该 指针 为 空 ， 那么 系统 将 会 把 从 设备 的 termios 结构 设置 成 实现 定义 的 初始 状态 。 类 似 地 ， 
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如 果 slave_winsize 指针 不 为 空 ， 那 么 按 该 指针 所 引用 的 结构 初始 化 从 设备 的 窗口 大 小 。 如 果 该 指 
EAT, winsize 结构 通常 被 初始 化 为 0。 

19-10 显示 了 该 函数 的 代码 。 它 调用 相应 的 ptym_open 和 ptys_open 函数 , 在 本 书 讨论 
的 4 种 平台 上 ，pty_fork 函数 都 能 工作 。 


#include "apue.h" 
#include <termios.h> 


pid_t 

pty_fork(int *ptrfdm, char *slave_name, int slave_namesz, 
const struct termios *slave_termios, 
const struct winsize *slave_winsize) 


int fdm, fds; 
pid_t pid; 
char pts_name [20]; 


if ((fdm = ptym_open(pts_name, sizeof(pts_name))) < 0) 
err sys("can't open master pty: $s, error $d", pts name, fdm); 


if (slave name !- NULL) ( 
/* 
* Return name of slave. Null terminate to handle case 
* where strlen(pts name) » slave namesz. 


*/ 
strncpy(slave name, pts name, slave namesz); 
slave name[slave namesz - 1] = '\O'; 


if ((pid = fork()) « 0) { 
return(-1); 
) else if (pid == 0) ( /* child */ 
if (setsid() < 0) 
err sys("setsid error"); 


/* 
* System V acquires controlling terminal on open(). 
bh 
if ((fds = ptys_open(pts_name)) < 0) 
err_sys("can't open slave pty"); 
close (fdm); /* all done with master in child */ 


#if defined (BSD) 
/* 
* TIOCSCTTY is the BSD way to acquire a controlling terminal. 
Ej 
if (ioctl(fds, TIOCSCTTY, (char *)0) < 0) 
err Sys("TIOCSCTTY error"); 


#endif 
/* 
* Set slave's termios and window size. 
ey 
if (slave termios != NULL) { 


if (tcsetattr(fds, TCSANOW, slave termios) < 0) 
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err_sys("tcsetattr error on slave pty"); 
} 
if (slave_winsize != NULL) { 
if (ioctl(fds, TIOCSWINSZ, slave_winsize) < 0) 
err Sys("TIOCSWINSZ error on slave pty"); 
} 


/* 
* Slave becomes stdin/stdout/stderr of child. 
mf 
if (dup2(fds, STDIN_FILENO) != STDIN_FILENO) 
err_sys("dup2 error to stdin"); 
if (dup2(fds, STDOUT_FILENO) != STDOUT_FILENO) 
err_sys("dup2 error to stdout"); 
if (dup2(fds, STDERR_FILENO) != STDERR_FILENO) 
err sys("dup2 error to stderr"); 
if (fds != STDIN FILENO && fds !- STDOUT FILENO && 
fds != STDERR FILENO) 
close(fds); 
return(0); /* child returns 0 just like fork() */ 
) else { /* parent */ 
*ptrfdm = fdm; /* return fd of master */ 
return (pid); /* parent returns pid of child */ 


19-10 pty fork 函数 

在 打开 PTY 主 设备 后 , 调用 fork. 正如 前 面 提 到 的 , 子 进程 先 调用 setsid 建立 新 的 会 话 ， 
然后 才 调 用 ptys_open。 当 调用 setsid 时 ， 子 进程 还 不 是 一 个 进程 组 的 首 进 程 ， 因 此 执行 9.5 
节 中 列 出 的 3 个 操作 步骤 : (a) 子 进程 创建 一 个 新 的 会 话 ， 它 是 该 会 话 的 首 进程 ; (b) 子 进 程 创 
建 一 个 新 的 进程 组 ; (oO. 子 进程 断 开 与 以 前 可 能 有 的 控制 终端 的 关联 ， 于 是 不 再 有 控制 终端 。 在 
Linux, Mac OS X fil Solaris 系统 中 ， 当 调用 ptys_open 时 ， 从 设备 成 为 新 会 话 的 控制 终端 。 在 
FreeBSD 系统 中 ， 必 须 调 用 TIOCSCTTY ioctl 来 分 配 一 个 控制 终端 。( 回 想 图 9-8， 其 他 3 个 平 
台 也 支持 TIOCSCTTY ioctl 命令 ， 但 是 只 有 在 FreeBSD 中 需要 我 们 去 调用 它 。) 

termios 和 winsize 这 两 个 结构 在 子 进程 中 初始 化 。 最 后 从 设备 的 文件 描述 符 被 复制 到 子 
进程 的 标准 输入 、 标 准 输出 和 标准 错误 中 。 这 意味 着 不 管子 进程 以 后 调用 exec 执行 何 种 程序 ， 
它 都 具有 同 PTY 从 设备 (其 控制 终端 联系 起 来 的 上 述 3 个 描述 符 。 

在 调用 fork 后 ， 父 进程 返回 PTY 主 设备 的 描述 符 以 及 子 进 程 的 进程 ID。 下 一 节 将 在 pty 
程序 中 使 用 pty_fork 函数 。 


19.5 pty 程序 


编写 pty 程序 的 目的 是 用 
pty prog argl arg2 
来 代替 


Prog argl arg2 
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当 用 pty 来 执行 另 一 个 程序 时 ， 那 个 程序 在 一 个 它 自 己 的 会 话 中 执行 ， 并 和 一 个 伪 终 端 连 接 。. 
让 我 们 查看 pty 程序 的 源 代码 。 第 一 个 文件 ( 见 图 19-11) 包含 main 函数 。 它 调用 上 一 节 
的 pty_fork AR. 


#include "apue.h" 
#include <termios.h> 


#ifdef LINUX 
#define OPTSTR "+d:einv" 


#else 

#define OPTSTR "d:einv" 

#endif 

static void set_noecho(int); /* at the end of this file */ 
void do_driver(char *); /* in the file driver.c */ 
void loop(int, int); /* in the file loop.c */ 

int 


main(int argc, char *argv[]) 


{ 


int fdm, c, ignoreeof, interactive, noecho, verbose; 
pid_t pid; 

char *driver; 

char slave_name[20]; 

struct termios orig_termios; 

struct winsize size; 


interactive = isatty(STDIN FILENO); 
ignoreeof = 0; 

noecho = 0; 

verbose = 0; 


driver = NULL; 
opterr = 0; /* don't want getopt() writing to stderr */ 
while ((c = getopt(argc, argv, OPTSTR)) != EOF) { 
switch (c) { 
case 'd': /* driver for stdin/stdout */ 
driver - optarg; 
break; 
case 'e': /* noecho for slave pty's line discipline */ 
noecho = 1; 
break; 
case 'i': /* ignore EOF on standard input */ 
ignoreeof - 1; 
break; 
case 'n': /* not interactive */ 
interactive - 0; 
break; 
case 'v': /* verbose */ 


verbose = 1; 
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break; 


case '2'; 
err quit("unrecognized option: -$c", optopt); 


) 
if (optind >= argc) * 
err_quit("usage: pty [ -d driver -einv ] program [ arg ... ]"); 


if (interactive) { /* fetch current termios and window size */ 
if (tcgetattr(STDIN FILENO, &orig termios) < 0) 
err sys("tcgetattr error on stdin"); 
if (ioctl(STDIN FILENO, TIOCGWINSZ, (char *) &size) « O0) 
err sys("TIOCGWINSZ error"); 
pid = pty fork(&fdm, slave name, sizeof(slave name), 
&orig termios, &size); 
) else ( 
pid = pty fork(&fdm, slave name, sizeof(slave name), 
NULL, NULL); 


if (pid « 0) { 
err sys("fork error"); 
} else if (pid == 0) { /* child */ 
if (noecho) 
set noecho(STDIN FILENO); /* stdin is slave pty */ 





if (execvp(argv[optind], &argv[optind]) < 0) 
err sys("can't execute: $s", argv[optind]); 


if (verbose) { 
fprintf(stderr, "slave name = %s\n", slave name); 
if (driver != NULL) 
fprintf(stderr, "driver = %s\n", driver); 


if (interactive && driver == NULL) { 
if (tty raw(STDIN FILENO) < 0) /* user's tty to raw mode */ 
err sys("tty raw error"); 
if (atexit(tty atexit) < 0) /* reset user's tty on exit */ 
err sys("atexit error"); 


if (driver) 


do driver (driver); /* changes our stdin/stdout */ 
loop(fdm, ignoreeof); /* copies stdin -> ptym, ptym -> stdout */ 
exit(0); 


static void 
set noecho(int fd) /* turn off echo (for slave pty) */ 


{ 
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struct termios stermios; 


if (tcgetattr(fd, &stermios) < 0) 
err_sys("tcgetattr error"); 


stermios.c lflag &= -(ECHO | ECHOE | ECHOK | ECHONL) ; 
/* 

* Also turn off NL to CR/NL mapping on output. 

wf 
stermios.c_oflag &= ~(ONLCR); 


if (tcsetattr(fd, TCSANOW, &stermios) < 0) 
err_sys("tcsetattr error"); 


图 19-11 pty 程序 的 main 函数 

下 一 节 介绍 pty 程序 的 不 同 用 途 时 ， 将 看 到 多 种 命令 行 选项 。getopt 函数 帮助 我 们 以 协调 
一 致 的 模式 分 析 命 令 行 参 数 。 为 了 在 Linux 系统 中 强制 POSIX 行为 ， 我 们 将 选项 字符 串 的 第 一 个 
字符 设置 为 加 号 。 731 

在 调用 pty_fork 前 ， 我 们 获取 termios 和 winsize 结构 的 当前 值 ， 将 其 作为 参数 传递 
给 pty_fork。 通 过 这 种 方法 ，PTY 从 设备 具有 和 当前 终端 相同 的 初始 状态 。 

子 进程 从 pty_fork 返回 后 ， 可 选 地 关闭 了 PTY 从 设备 的 回 显 ， 然 后 调用 execvp 来 执行 
命令 行 指定 的 程序 。 所 有 余下 的 命令 行 参 数 将 成 为 该 程序 的 参数 。 

父 进 程 可 选 地 将 用 户 终端 设置 为 原始 模式 。 在 这 种 情况 下 ， 父 进程 还 要 设置 退出 处 理 程 序 ， 
使 得 在 调用 exit 时 复原 终端 状态 。 下 一 节 将 描述 do_driver 函数 。 

接 下 来 ， 父 进程 调用 函数 loop (WR 19-12)， 该 函数 仅仅 是 将 从 标准 输入 接收 到 的 所 有 内 
容 复 制 到 PTY 主 设备 ， 并 将 PTY 主 设备 接收 到 的 所 有 内 容 复制 到 标准 输出 。 尽 管 使 用 select 
8& poll 的 单 进程 或 多 线程 是 可 行 的 ， 但 是 为 了 有 所 变化 ， 这 里 使 用 了 两 个 进程 。 


#include "apue.h" 
#define BUFFSIZE 512 


static void sig_term(int); 
static volatile sig_atomic_t sigcaught; /* set by signal handler */ 


void 
loop(int ptym, int ignoreeof) 
{ 

pid_t child; 

int nread; 

char buf [BUFFSIZE] ; 


if ((child = fork()) < 0) { 
err_sys ("fork error"); 
} else if (child == 0) ( /* child copies stdin to ptym */ 
for | 2 2.) 1 
if ((nread = read(STDIN FILENO, buf, BUFFSIZE)) < 0) 
err sys("read error from stdin"); 
else if (nread == 0) 
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break; /* EOF on stdin means we're done */ 
if (writen(ptym, buf, nread) != nread) 
err_sys ("writen error to master pty"); 


/* 
* We always terminate when we encounter an EOF on stdin, 
* but we notify the parent only if ignoreeof is 0. 
4 
if (ignoreeof == 0) 
kill(getppid(), SIGTERM); /* notify parent */ 
exit(0); /* and terminate; child can't return */ 


/* 

* Parent copies ptym to stdout. 

"y 

if (signal intr(SIGTERM, sig term) -- SIG ERR) 


err sys("signal intr error for SIGTERM"); 


for ( rs A 
if ((nread = read(ptym, buf, BUFFSIZE)) <= 0) 
break; /* signal caught, error, or EOF */ 
if (writen(STDOUT FILENO, buf, nread) !- nread) 
err sys("writen error to stdout"); 


/* 

* There are three ways to get here: sig term() below caught the 

* SIGTERM from the child, we read an EOF on the pty master (which 

* means we have to signal the child to stop), or an error. 

Ry 

if (sigcaught -- 0) /* tell child if it didn't send us the signal */ 
kill(child, SIGTERM); 


/* 
* Parent returns to caller. 
R 


/* 
* The child sends us SIGTERM when it gets EOF on the pty slave or 
* when read() fails. We probably interrupted the read() of ptym. 
KT 
static void 
sig term(int signo) 


{ 
sigcaught = 1; /* just set flag and return */ 


图 19-12 loop 函数 
注意 ， 因 为 使 用 了 两 个 进程 ， 所 以 一 个 终止 时 ， 必 须 通知 另 一 个 。 我 们 用 SIGTERM fa SHE 
行 这 种 通知 。 
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接 下 来 看 几 个 pty 程序 的 应 用 实例 ， 并 了 解 使 用 不 同 命令 行 选项 的 必要 性 。 
如 果 使 用 Korn shell， 那 么 我 们 执行 命令 : 


pty ksh 

会 得 到 一 个 运行 在 伪 终 端 下 的 全 新 shell。 
如 果 文 件 ttyname 包含 了 图 18-16 中 所 示 的 程序 ， 那 么 可 按 如 下 模式 执行 pty 程序 : 
$ who 


sar console May 19 16:47 
sar ttys000 May 19 16:47 
sar ttys001 May 19 16:48 
sar ttys002 May 19 16:48 
sar ttys003 May 19 16:49 


sar ttys004 May 19 16:49 ttys004 是 当前 使 用 的 最 高 PTY 设备 
$ pty ttyname 在 PTY 上 运行 图 18-16 中 的 程序 
fd 0: /dev/ttys005 ttys005 是 下 一 个 可 用 的 PTY 


fd 1: /dev/ttys005 
fd 2: /dev/ttys005 


1. utmp 文件 

6.8 节 讨 论 过 记录 当前 登录 到 UNIX 系统 的 用 户 的 utmp 文件 。 那 么 在 伪 终 端 上 运行 程序 的 用 
户 是 否 被 认为 是 登录 了 了 呢 ? 如 果 是 用 telnetd M rlogind 远程 登录 ， 显 然 在 伪 终 端 上 登录 的 用 
户 应 该 在 utmp 文件 中 有 相应 记录 项 。 但 是 ,通过 窗口 系统 或 script 类 程序 在 伪 终 端 上 运行 shell 
的 用 户 是 否 应 该 在 utmp 文件 中 有 相应 记录 项 呢 ? 有 的 系统 有 记录 ， 有 的 没有 。 如 果 在 utmp X 
件 中 没有 记录 的 话 ，who(1) 程 序 一 般 不 会 显示 相应 伪 终 端正 在 被 使 用 。 

除非 utmp 文件 允许 其 他 用 户 的 写 权限 (这 被 认为 是 一 个 安全 漏洞 ), 否则 一 般 使 用 伪 终 端的 
程序 将 不 能 对 utmp 文件 进行 写 操 作 。 

2. 作业 控制 交互 

当 在 pty 下 运行 作业 控制 shell 时 ， 它 能 够 正常 地 运行 。 例 如 ， 


pty ksh 


将 在 pty 下 运行 Korn shell。 我 们 能 够 在 这 个 新 shell 下 运行 程序 并 使 用 作业 控制 ， 这 如 同 在 登录 
shell 中 一 样 。 但 如 果 在 pty 下 运行 一 个 交互 式 程序 而 不 是 作业 控制 shell， 例 如 ， 

pty cat 
那么 在 键入 作业 控制 挂 起 字符 之 前 该 程序 的 运行 一 切 正常 。 而 在 键入 作业 控制 挂 起 字符 时 ， 作 业 
控制 挂 起 字符 将 会 被 显示 为 ^2， 并 且 被 忽略 。 在 早期 基于 BSD 的 系统 中 ，cat 进程 终止 ，pty 
进程 终止 ， 回 到 初始 登录 shell。 为 了 明白 其 中 的 原因 ， 我 们 需要 检查 所 有 相关 的 进程 以 及 这 些 进 
程 所 属 的 进程 组 和 会 话 。 图 19-13 显示 了 pty cat 运行 时 的 安排 。 

键入 挂 起 字符 〈Ctrl+Z) 时 ， 它 被 cat 进程 下 的 行规 程 模块 所 识别 ， 这 是 因为 pty 将 终端 (在 
pty 父 进程 之 下 ) 设置 为 原始 模式 。 但 内 核 不 会 停止 cat 进程 ， 这 是 因为 它 属于 一 个 孤儿 进程 组 
( 见 9.10 节 )。cat 的 父 进程 是 pty 父 进程 ， 它 属于 另 一 个 会 话 。 
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图 19-13 pty cat 的 进程 组 和 会 话 

历史 上 ， 不 同 的 系统 处 理 这 种 情况 的 方法 也 不 同 。POSIX.1 只 是 说 明 SIGTSTP 信号 不 能 被 
发 送 给 进程 。4.3BSD 的 派生 系统 向 进程 递送 一 个 它 从 不 捕获 的 SIGKILL 信号 。4.4BSD 没有 采 
用 发 送 SIGKILL 信和 号 的 方法 ， 转 而 采用 符合 于 POSIX.1 的 处 理 方法 。 如 果 SIGTSTP 信号 具有 
默认 配置 ， 并 且 传 递 给 孤儿 进程 组 中 的 一 个 进程 ， 那 么 4.4BSD 的 内 核 会 无 声息 地 丢弃 SIGTSTP 
信号 。 大 多 数 当前 的 实现 都 采用 这 种 处 理 模式 。 

当 我 们 使 用 pty 来 运行 作业 控制 shell 时 ， 被 这 个 新 shell 调用 的 作业 决 不 会 是 任何 孤儿 进程 
组 的 成 员 ， 这 是 因为 作业 控制 shell 总 是 属于 同一 个 会 话 。 在 这 种 情况 下 ， 键 入 的 Ctrl+Z 被 发 送 
到 由 shell 调用 的 进程 ， 而 不 是 shell 本 身 。 

让 pty 调用 的 进程 能 够 处 理 作业 控制 信号 的 唯一 的 方法 是 : 另外 增加 一 个 pty 命令 行 标志 ， 
使 pty 子 进程 自己 能 够 识别 作业 挂 起 字符 (在 pty 子 进程 中 )， 而 不 是 让 该 字符 穿越 所 有 路 程 而 
到 达 另 一 个 行规 程 模块 。 

3. 检查 长 时 间 运 行程 序 的 输出 

另 一 个 使 用 pty 进行 作业 控制 交互 的 实例 见 图 19-7。 如 果 运 行 一 个 缓慢 产生 输出 的 程序 : 

pty slowout > file.out & 
当 子 进程 试图 从 标准 输入 (终端 ) 读 入 数据 时 ，pty 进程 立刻 停止 运行 。 这 是 因为 该 作业 是 一 个 
后 台 作 业 ， 并 且 当 它 试图 访问 终端 时 会 使 作业 控制 停止 。 如 果 将 标准 输入 重 定向 使 得 pty 不 从 终 
端 读 取 数据 ， 如 : 

pty slowout < /dev/null > file.out & 
MA pty 程序 也 立即 停止 因为 它 从 标准 输入 和 终端 读 取 到 一 个 文件 结束 符 。 解决 这 个 问题 的 方 
法 是 使 用 -i 选项 ， 这 个 选项 的 含义 是 忽略 来 自 标准 输入 的 文件 结束 符 : 

pty -i slowout < /dev/null > file.out & 
这 个 标志 导致 在 遇 到 文件 结束 符 时 , 图 19-13 的 pty 子 进程 退出 , 但 子 进程 不 会 告诉 父 进程 终止 。 
相反 ， 父 进程 一 直 将 PTY 从 设备 的 输出 复制 到 标准 输出 〈 本 例 中 是 文件 file .out)。 
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4. script 程序 

使 用 pty 程序 可 以 把 script(1) 程 序 实现 成 下 面 shell 脚本 : 
#!/bin/sh 

pty "S(SHELL:-/bin/sh)" | tee typescript 


一 旦 执行 这 个 shell 脚本 ， 即 可 执行 ps 命令 来 观察 进程 之 间 的 关系 。 图 19-14 详细 地 显示 了 这 些 
关系 。 


typescript 
文件 














19-14 script shell 脚本 的 进程 安排 

在 这 个 例子 中 ， 假 设 SHELL 变量 是 Korn shell (可 能 是 /bin/ksh)。 如 前 面 所 述 ，script 
仅仅 是 将 新 的 shell. (和 它 调用 的 所 有 的 子 进程 ) 的 输出 复制 出 来 ， 但 是 因为 PTY 从 设备 上 的 行 
规程 模块 通常 允许 回 显 ， 所 以 绝 大 多 数 键 入 也 都 被 写 到 typescript 文件 中 。 

5. 运行 协同 进程 

在 图 15-8 所 示 的 程序 中 ， 协 同 进程 不 能 使 用 标准 IO 函数 ， 其 原因 是 标准 输入 和 标准 输出 不 
是 终端 ， 所 以 标准 VO 函数 会 将 它们 放 到 缓冲 区 中 。 如 果 把 

if (execl("./add2", "add2", (char *)0) < 0) 
替换 成 

if (execl("./pty", "pty", "-e", "add2", (char *)0) < 0) 
在 pty 下 运行 协同 进程 ， 该 程序 即使 使 用 了 标准 VO 仍然 可 以 正确 运行 。 

图 19-15 显示 了 在 使 用 伪 终 端 作 为 协同 进程 的 输入 和 输出 时 ， 进 程 的 安排 。 这 是 图 19-6 的 扩 
充 ， 它 显示 了 所 有 的 进程 连接 和 数据 流 。 框 中 的 “驱动 程序 ”是 按 前 面 的 说 明 更 改 了 execl 的 
图 15-8 的 程序 。 

这 一 实例 显示 了 -e〔 不 回 显 ) 选项 对 于 pty 程序 的 重要 性 。 因 为 pty 程序 的 标准 输入 没有 


736 


连接 到 终端 ， 所 以 它 不 以 交互 方式 运行 。 在 图 19-11 BFE, interactive 标志 默认 为 假 ， 这 


是 因为 对 isatty 调用 的 返回 是 假 。 这 意味 着 真正 终端 上 的 行规 程 保持 在 规范 模式 下 ， 并 允许 回 
显 。 指 定 -e 选项 后 ， 关 掉 了 PTY 从 设备 上 的 行规 程 模块 的 回 显 。 如 果 不 这 样 做 ， 则 键入 的 每 一 
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个 字符 都 将 被 两 个 行规 程 模块 各 回 显 一 次 。 


fork, exec 























图 19-15 ”运行 一 个 协同 进程 ， 以 伪 终端 作为 其 输入 和 输出 

还 能 用 -e 选项 关闭 termios 结构 的 ONLCR 标志 ， 以 防止 所 有 协同 进程 的 输出 被 回 车 和 换 
行 符 终止 。 

在 不 同 的 系统 上 测试 这 个 例子 ， 会 遇 到 14.7 节 中 描述 readn 和 writen 函数 时 顺便 提 到 的 
同样 问题 。 当 描述 符 引用 的 不 是 普通 磁盘 文件 时 ， 从 read 返回 的 数据 量 可 能 会 因 两 个 实现 之 间 
的 不 同 而 有 所 区 别 。 使 用 pty 的 协同 进程 实例 产生 了 非 预 期 的 结果 ， 其 原因 可 追溯 至 图 15-18 的 
程序 中 读 管道 的 read 函数 ， 它 返回 的 结果 不 足 一 行 。 解 决 方法 是 不 使 用 图 15-18 中 的 程序 ， 而 
是 要 使 用 来 自 于 习题 15.5 针对 这 个 程序 的 另外 一 个 版 本 ， 这 个 版 本 改 用 标准 IO 库 ， 将 两 个 管道 
的 标准 IO 流 都 设置 为 行 缓冲 。 这 样 , fgets 函数 将 会 读 完 一 个 整 行 。 图 15-18 的 程序 中 的 while 
循环 假设 发 送 到 协同 进程 的 每 一 行 都 会 带 来 一 行 的 返回 结果 。 

6. 非 交 互 地 驱动 交互 式 程序 

虽然 让 pty 运行 任意 协同 进程 ， 甚 至 交互 式 的 协同 进程 的 想法 很 诱 人 ， 但 这 是 行 不 通 的 。 问 
题 在 于 pty 只 是 将 其 标准 输入 复制 到 PTY， 并 将 来 自 PTY 的 数据 复制 到 其 标准 输出 ， 而 并 不 关 
心 具体 发 送 的 或 得 到 的 是 什么 数据 。 

举 个 例子 ， 我 们 可 以 在 pty FZI telnet 命令 ， 直 接 与 远程 主机 对 话 : 

pty telnet 192.168.1.3 


这 样 做 与 直接 键入 telnet 192.168.1.3 相 比 ， 并 没有 带 来 更 多 的 好 处 ， 但 我 们 可 能 希望 在 一 个 
脚本 中 运行 telnet 程序 ， 其 目的 很 可 能 是 要 检验 远程 主机 的 某 个 条 件 。 如 果 telnet . cma 文件 包 
括 下 面 4 行 : 

Ad 


uptime 
exit 


第 1 行 是 登录 到 远程 主机 时 使 用 的 用 户 名 ， 第 2 行 是 口令 ， 第 3 行 是 希望 运行 的 命令 ， 第 4 行 终 
止 此 会 话 。 如 果 按 下 列 方式 运行 此 脚本 : 
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pty -i < telnet.cmd telnet 192.168.1.3 


那么 ， 它 不 会 像 我 们 所 想 的 那样 操作 。 而 是 ，telnet .cmd 文件 的 内 容 在 还 没有 得 到 机 会 提示 
我 们 输入 账户 名 和 口令 之 前 ， 就 被 发 送 到 了 远程 主机 。 当 它 关 闭 回 显 而 读 口令 时 ，1login 使 
用 tcsetattr 选项 ， 于 是 丢弃 了 已 在 队列 中 的 所 有 数据 。 这 样 一 来 ， 我 们 发 送 的 数据 就 被 
丢掉 了 。 

当 以 交互 方式 运行 telnet 程序 时 ， 我 们 等 待 远 程 主机 发 出 输入 口令 的 提示 ， 然 后 再 键入 口 
4, (A pty 程序 不 知道 这 样 做 。 这 就 是 需要 一 个 比 pty 更 巧妙 的 程序 ， 如 expect， 从 脚本 文 
件 驱 动 交 互 式 程序 的 原因 。 

即使 如 前 所 示 那 样 从 图 15-18 程序 运行 pty， 这 也 没有 任何 帮助 。 因 为 图 15-18 中 的 程序 认 
为 它 在 一 个 管道 写 入 的 每 一 行 都 会 在 另 一 个 管道 产生 一 行 。 对 于 一 个 交互 式 程序 ， 输 入 一 行 可 能 
产生 多 行 输出 。 更 进一步 ， 图 15-18 中 的 程序 在 从 协同 进程 读 之 前 ， 它 总 是 先 发 送 一 行 给 该 进程 。 
如 果 想 在 发 送 给 协同 进程 一 些 数 据 之 前 从 协同 进程 处 读 ， 这 种 策略 就 行 不 通 了 。 

有 一 些 从 shell 脚本 驱动 交互 式 程序 的 方法 。 可 以 在 pty 上 增加 一 种 命令 语言 和 一 个 解释 
器 。 但 是 一 个 适当 的 命令 语言 可 能 十 倍 于 pty 程序 的 大 小 。 男 一 种 选择 是 使 用 命令 语言 并 用 
pty fork 函数 来 调用 交互 式 程序 ， 这 正 是 expect 程序 所 做 的 。 

我 们 将 采用 一 种 不 同 的 途径 ， 使 用 选项 -qd 使 pty 程序 的 输入 和 输出 与 驱动 进程 连接 起 来 。 
该 驱动 进程 的 标准 输出 是 pty 的 标准 输入 ， 反 之 亦 然 。 这 有 点 像 协 同 进 程 ， 只 是 在 pty 的 “ 男 
一 边 ”。 此 种 进程 结构 与 图 19-15 中 所 示 的 几乎 相同 ， 只 是 在 这 种 场景 中 ， 由 Pty 来 完成 驱动 进 
FER fork 和 exec。 而 且 我 们 在 pty 和 驱动 进程 二 者 之 间 使 用 的 是 一 个 双向 的 流 管道 ， 而 不 是 
两 个 半 双 工 管道 。 

19-16 展示 的 是 do driver 函数 的 源 代码 ， 在 使 用 -d 选项 时 ， 该 函数 由 Pty CAR 19-11) 
的 main 函数 调用 。 


#include "apue.h" 


void 
do_driver(char *driver) 
{ 

pid_t child; 


int pipe(2]; 

/* 

* Create a full-duplex pipe to communicate with the driver. 
a 


if (fd_pipe(pipe) < 0) 
err_sys("can't create stream pipe"); 


if ((child = fork()) < 0) { 
err_sys("fork error"); 

} else if (child == 0) { /* child */ 
close (pipe[1]); 


/* stdin for driver */ 
if (dup2(pipe[0], STDIN FILENO) !- STDIN FILENO) 
err sys("dup2 error to stdin"); 
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/* stdout for driver */ 


if (dup2(pipe[0], STDOUT_FILENO) != STDOUT_FILENO) 
err_sys("dup2 error to stdout"); 
if (pipe[0] != STDIN_FILENO && pipe[0] != STDOUT FILENO) 


close (pipe[0]); 


/* leave stderr for driver alone */ 
execlp(driver, driver, (char *)0); 
err sys("execlp error for: $s", driver); 


} 


close (pipe[0]); /* parent */ 
if (dup2(pipe[1], STDIN FILENO) !- STDIN FILENO) 
err sys("dup2 error to stdin"); 
if (dup2(pipe[1], STDOUT FILENO) !- STDOUT FILENO) 
err sys("dup2 error to stdout"); 
if (pipe[1] != STDIN FILENO && pipe[1] !- STDOUT FILENO) 


close (pipe[1]); 


/* 

* Parent returns, but with stdin and stdout connected 
* to the driver. 

y 


K 19-16 pty 程序 的 do driver 函数 
通过 我 们 自己 编写 由 pty 调用 的 驱动 程序 ， 可 以 按 我 们 所 希望 的 方式 驱动 交互 式 程序 。 即 使 
驱动 程序 有 和 pty 连接 在 一 起 的 标准 输入 和 标准 输出 ， 驱 动 进 程 仍然 可 以 通过 读 、 写 /dev/tty 
同 用 户 交 互 。 这 个 解决 方法 仍 不 如 expect 程序 通用 ， 但 是 它 用 不 到 50 行 的 代码 提供 了 pty 的 
一 种 实用 的 选项 。 


19.7 ”高 级 特性 


伪 终 端 还 有 其 他 特性 ， 我 们 在 这 里 简略 提 一 下 。Sun Microsystems[2002] 和 BSD pts(4) 的 手 
册页 对 此 有 更 详细 的 说 明 。 

1. 打包 模式 

打包 模式 Cpacket mode) 能 够 使 PTY 主 设备 了 解 到 PTY 从 设备 的 状态 变化 。 在 Solaris 系 
统 中 ， 可 以 通过 将 STREAMS 模块 pekt EA PTY 主 设备 端 来 设置 这 种 模式 。 图 19-2 显示 了 
这 种 可 选 模块 。 在 FreeBSD. Linux Ñ Mac OS X 中 ， 可 以 用 TIOCPKT ioctl 命令 来 设置 这 
种 模式 。 

Solaris 和 其 他 平台 相 比 较 ， 有 具体 的 打包 模式 有 所 不 同 。 在 Solaris 中 ， 读 取 PTY 主 设备 的 进 
程 必须 调用 getmsg 从 流 首 取得 消息 ， 这 是 因为 pckt 模块 将 一 些 事件 转化 成 了 无 数据 的 
STREAMS 消息 。 在 其 他 平台 中 ， 每 一 次 对 PTY 主 设备 的 读 操 作 都 会 返回 带 有 可 选 数据 的 状态 字 节 。 

无 论 实现 细节 如 何 ， 打 包 模 式 的 目的 是 ， 当 PTY 从 设备 上 的 行规 程 模 块 出 现 以 下 事件 时 , 通 
知 进程 从 PTY 主 设备 读 取 数据 : 读 队 列 被 冲洗 ， 写 队列 被 冲洗 ， 输 出 被 停止 〈 如 Ctrl+S)， 输 出 
重新 开始 ，XON/XOFF 流 控 制 被 禁用 后 重新 启用 ，XON/XOFF 流 控制 被 启用 后 重新 禁用 。 这 些 
事件 由 rlogin 客户 进程 和 rlogind 服务 器 进程 使 用 。 
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2. 远程 模式 

PTY 主 设备 可 以 用 TIOCREMOTE ioctl 命令 将 PTY 从 设备 设置 成 远程 模式 。 虽 然 FreeBSD. 
Mac OS X 10.6.8 和 Solaris 10 使 用 同样 的 命令 来 启用 或 禁用 这 个 特性 ， 但 是 在 Solaris H, ioctl 
的 第 三 个 参数 是 一 个 整 型 数 ， 而 在 Mac OS X 中 则 是 一 个 指向 整 型 数 的 指针 。(FreeBSD 8.0 和 Linux 
3.2.0 不 支持 这 一 命令 。) 

当 PTY 主 设备 将 PTY 从 设备 设置 成 这 种 模式 时 , 它 通 知 PTY 从 设备 上 的 行规 程 模块 对 从 主 
设备 接收 到 的 任何 数据 都 不 进行 任何 处 理 ， 不 管 从 设备 termios 结构 中 的 规范 或 非 规 范 标 志 是 
否 设 置 ， 都 是 这 样 。 远 程 模式 适用 于 窗口 管理 器 这 种 进行 自己 的 行 编辑 的 应 用 程序 。 

3. 窗口 大 小 变化 

PTY 主 设备 上 的 进程 可 以 用 TIOCSWINSZ ioctl 命令 来 设置 从 设备 的 窗口 大 小 。 如 果 新 的 
大 小 和 当前 的 大 小 不 同 ，SIGWINCH 信和 号 将 被 发 送 到 PTY 从 设备 的 前 台 进 程 组 。 

4. 信号 发 生 

读 、 写 PTY 主 设备 的 进程 可 以 向 PTY 从 设备 的 进程 组 发 送信 号 。 在 Solaris 10 中 ， 可 以 用 
TIOCSIGNAL ioctl 命令 做 到 这 一 点 。 在 FreeBSD 8.0、Linux 3.2.0 和 Mac OS X 10.6.8 中 ， 用 
TIOCSIG ioctl 来 做 到 这 一 点 。 在 这 两 种 情况 下 ， 第 三 个 参数 都 是 信号 编号 值 。 


19.8 ”小结 


本 章 开 始 部 分 简要 叙述 了 如 何 使 用 伪 终 端 ， 并 观察 了 某 些 应 用 实例 。 接 着 ， 分 析 说 明了 在 本 书 
讨论 的 4 种 平台 上 打开 伪 终 端 所 需 的 代码 。 然 后 用 此 代码 提供 了 通用 pty_fork 函数 , 它 可 用 于 多 
种 不 同 的 应 用 。 该 函数 是 小 程序 (ty) 的 基础 ， 我 们 使 用 这 一 程序 揭示 了 伪 终 端的 许多 属性 。 

伪 终 端 在 大 多 数 UNIX 系统 中 每 天 都 被 用 来 进行 网 络 登录 。 我 们 还 检查 了 伪 终 端的 许多 其 他 
用 途 ， 从 script 程序 到 使 用 批 处 理 脚本 来 驱动 交互 式 程序 等 。 


习题 


19.1 当 用 telnet Ek rlogin 远程 登录 到 一 个 BSD 系统 上 时 ， 像 我 们 在 19.3 节 讨 论 过 的 那样 ， 
PTY 从 设备 的 所 有 权 和 权限 被 设置 。 该 过 程 是 如 何 发 生 的 ? 

19.2 使 用 pty 程序 来 确定 你 的 系统 用 于 初始 化 PTY 从 设备 的 termios 结构 和 winsize 结构 
的 值 。 

19.3 HS loop 函数 〈 见 图 19-12)， 使 之 成 为 使 用 select R poll 的 单个 进程 。 

19.4 在 子 进程 中 ，pty_fork 返回 后 ， 标 准 输入 、 标 准 输 出 和 标准 错误 都 以 读 写 模 式 打开 。 能 够 
将 标准 输入 变 成 只 读 ， 另 两 个 变 成 只 写 吗 ? 

19.5 在 图 19-13 中 ， 指 出 哪些 进程 组 是 前 台 的 ， 哪 些 进程 组 是 后 台 的 ， 并 指出 会 话 首 进程 。 

19.6 在 图 19-13 中 ， 当 键入 文件 终止 符 时 ， 进 程 终止 的 顺序 是 什么 ?如 果 可 能 的 话 ， 用 进程 会 计 
信息 验证 之 。 

19.7 script(1) 程 序 通 常 在 输出 文件 头 增加 一 行 说 明 它 的 开始 时 间 , 在 输出 文件 末尾 增加 一 行 说 
明 它 的 结束 时 间 。 将 这 些 特性 添加 到 本 章 展示 的 简单 的 shell 脚本 中 。 

19.8 解释 为 什么 在 下 面 的 例子 中 ， 即 使 程序 ttyname 〈 见 图 18-16) 只 产生 输出 而 不 读 入 的 情 
况 下 ， 文 件 data 的 内 容 还 被 输出 到 终端 上 。 
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19.9 


$ cat data 一 个 两 行 的 文件 

hello, 

world 

$ pty -i < data ttyname -i -i 表示 忽略 stdin 的 文件 结束 标志 
hello, 这 两 行 来 自 何 处 ? 

world 

fd 0:/dev/ttys005 我 们 期 望 ttyname 输出 这 3 行 


fd 1:/dev/ttys005 
fd 2:/dev/ttys005 


编写 一 个 调用 pty fork 的 程序 ， 该 程序 有 一 个 子 进程 ， 该 子 进程 exec 另 一 个 你 写 的 程 
序 。 子 进程 exec 的 新 程序 能 够 捕获 SIGTERM 和 SIGWINCH。 当 捕获 到 信号 时 ， 要 打印 出 
有 关 消 息 ， 并 且 对 于 后 一 种 信号 ， 还 要 打印 终端 窗口 大 小 。 然 后 让 父 进程 用 19.7 节 描 述 过 
的 ioctl 命令 向 PTY 从 设备 的 进程 组 发 送 SIGTERM 信号 。 从 PTY 从 设备 读 回 消息 并 验 
证 捕获 到 了 该 信号 。 接 下 来 由 父 进 程 设置 PTY 从 设备 窗口 的 大 小 ， 并 再 读 回 PTY 从 设备 的 
输出 。 让 父 进程 退出 (exit) 并 确定 PTY 从 设备 进程 是 否 也 要 终止 ,如果 要 终止 ， 应 如 何 
终止 ? 
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20.1 引言 


20 世纪 80 年 代 早 期 ，UNIX 系统 被 认为 不 适合 运行 多 用 户 数据 库 系统 ( 见 Stonebraker[1981] 
和 Weinberger[1982])。 早 期 的 系统 (如 V7)， 因 为 没有 提供 任何 形式 的 IPC 机 制 (除了 半 双 工 管 
道 )， 也 没有 提供 任何 形式 的 字 节 范围 锁 机 制 ， 所 以 确实 不 适合 运行 多 用 户 数据 库 系统 。 但 是 ， 
这 些 缺 陷 中 的 大 多 数 都 已 得 到 纠正 。 到 20 世纪 了 80 年 代 后 期 ，UNIX 系统 已 为 运行 可 靠 的 、 多 
用 户 的 数据 库 系 统 提 供 了 一 个 适合 的 环境 。 自 那 时 以 来 ， 很 多 商业 公司 都 已 提供 这 种 数据 库 系 统 。 

本 章 将 开发 一 个 简单 的 、 多 用 户 数据 库 的 C 函数 库 。 调 用 此 函数 库 提供 的 C 语言 函数 ， 其 他 
程序 可 以 获取 和 存储 数据 库 中 的 记录 。( 这 类 数据 库 通 常 被 称 为 键 - 值 存 储 。) 这 个 C 函数 库 只 是 
一 个 完整 的 数据 库 系统 的 一 部 分 ， 我 们 并 不 开发 其 他 部 分 〈 如 查询 语言 等 )， 关 于 其 他 部 分 可 以 
参阅 专门 介绍 数据 库 的 教科 书 。 我 们 感 兴趣 的 是 数据 库 函 数 库 与 UNIX 的 接口 ， 以 及 这 些 接口 与 
前 面 各 章节 所 涉及 主题 的 关系 (如 14.3 节 的 字 节 范围 锁 )。 


20.2 历史 


dbm(3) 是 一 个 在 UNIX 系统 中 很 流行 的 数据 库 函 数 库 ， 它 由 Ken Thompson 开发 ， 使 用 了 动 
态 散 列 结构 。 最 初 ， 它 与 V7 一 起 提供 ， 并 出 现在 所 有 BSD 版 本 中 ， 也 包含 在 SVR4 的 BSD 3E 
容 函 数 库 中 [AT&T 1990c]. BSD 的 开发 者 扩充 了 dbm 函数 库 ， 并 将 它 称 为 ndbm。ndbm 函数 库 
包括 在 BSD 和 SVR4 F. ndbm 函数 是 Single UNIX Specification 的 XSI 扩展 标准 的 一 部 分 。 

Seltzer 和 Yigit[1991] 中 详细 介绍 了 dom 函数 库 使 用 的 动态 散 列 算法 的 历史 , 以 及 这 个 库 的 其 
他 实现 方法 ， 如 dbm 函数 库 的 GNU 版 本 gdbm。 但 是 ， 这 些 实现 的 一 个 根本 限制 是 它们 都 不 支 
持 多 个 进程 对 数据 库 的 并 发 更 新 。 它 们 都 没有 提供 并 发 控制 (如 记录 锁 机 制 )。 

4.4BSD 提供 了 一 个 新 的 库 一 一 dpb(3)， 该 库 支持 3 种 不 同 的 访问 模式 : 面向 记录 、 散 列 和 B 
树 。 同 样 ，db 也 没有 提供 并 发 控制 (这 一 点 在 db(3) 手 册页 的 BUGS 部 分 说 得 很 清楚 )。 

Oracle (http://www.oracle.com) 提供 了 几 个 版 本 的 db 函数 库 ， 它 们 支持 并 发 访问 、 
锁 机 制 和 事务 。 

大 部 分 商用 数据 库 函 数 库 提供 多 进程 同时 更 新 数据 库 所 需要 的 并 发 控制 。 这 些 系统 一 般 都 使 
用 14.3 节 中 介绍 的 建议 记录 锁 机 制 ， 但 是 ， 它 们 也 常常 实现 自己 的 锁 原 语 ， 以 避免 为 获得 一 把 无 
竞争 锁 而 需 的 系统 调用 开销 。 这 些 商 用 系统 通常 用 B+ 树 [Comer 1979] 或 某 种 动态 散 列 技术 ， 如 线 
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性 散 列 [Litwin 1980] 或 者 可 扩展 的 散 列 [Fagin et al. 1979] 来 实现 数据 库 。 
图 20-1 列 出 了 本 书 说 明 的 4 种 操作 系统 常用 的 数据 库 函数 库 。 注 意 在 Linux 上 ，gdbm ÆR 
支持 dbm 函数 库 ， 又 支持 ndbm 函数 库 。 


POSIX.1 FreeBSD 8.0 Linux 3.2.0 Mac OS X 10.6.8 Solaris 10 


dbm gdbm . 
ndbm XSI . gdbm . . 
db . 。 。 


图 20-1 多 种 平台 支持 的 数据 库 函 数 库 





20.3 ”函数 库 


本 章 开 发 的 函数 库 类 似 于 ndbm 函数 库 ， 但 增加 了 并 发 控制 机 制 ， 从 而 允许 多 进程 同时 更 新 
同一 数据 库 。 本 节 将 首先 描述 数据 库 函 数 库 的 C 语言 接口 ， 下 一 节 再 讨论 其 实现 。 
当 打开 一 个 数据 库 时 ， 通 过 返回 值得 到 一 个 代表 数据 库 的 句柄 〈 一 个 不 透明 指针 )。 将 用 此 
744] 句柄 作为 参数 来 调用 其 他 数据 库 函 数 。 


#include "apue db.h" 


DBHANDLE db open(const char *pathname, int oflag, ... /* int mode */); 


返回 值 : 若 成 功 ， 返 回 数据 库 句 柄 ; 若 失 败 ， 返 回 NULL 





void db close(DBHANDLE db); 


如 果 db open 成 功 返 回 ， 则 将 建立 两 个 文件 : pathname.idx 和 pathname.dat, pathname.idx 
是 索引 文件 ，pathname.dat 是 数据 文件 。 参 数 oflag 作为 传递 给 open (93.3 节 ) 的 第 二 个 参数 ， 
来 指定 这 些 文件 的 打开 模式 〈 只 读 、 读 / 写 或 如 果 文 件 不 存在 则 创建 等 )。 如 果 需 要 建立 新 的 数据 
FE, mode 将 作为 第 三 个 参数 传递 给 open 文件 访问 权限 )。 

当 不 再 使 用 数据 库 时 ， 调 用 db_close 来 关闭 数据 库 。db_close 将 关闭 索引 文件 和 数据 文 
件 ， 并 释放 数据 库 使 用 过 程 中 分 配 到 的 所 有 用 于 内 部 缓冲 区 的 存储 空间 。 

当 向 数据 库 中 存 入 一 条 新 的 记录 时 ， 必 须 提供 一 个 此 记录 的 键 ， 以 及 与 此 键 相 关联 的 数据 。 如 
果 此 数据 库存 储 的 是 人 事 信息 ， 键 可 以 是 员工 ID,， 数 据 可 以 是 此 员工 的 姓名 、 地 址 、 电 话 号 码 以 及 
受聘 日 期 等 。 实现 要 求 每 条 记录 的 键 必须 是 唯一 的 (例如 , 不 会 有 两 个 员工 记录 有 同样 的 员工 ID )。 


#include "apue_db.h" 





int db store(DBHANDLE db, const char *key, const char *data, int flag); 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 非 0 值 ( 见 下 ) 





key 和 data 是 由 null 字符 终止 的 字符 串 。 它 们 可 以 包含 除了 null 字符 外 的 任何 字符 ， 如 换行 符 。 

flag 参数 只 能 是 DB_INSERT (插入 一 条 新 记录 )、DB_REPLACE (替换 一 条 已 有 的 记录 ) 或 
DB STORE (插入 一 条 新 记录 或 替换 一 条 已 有 的 记录 ， 只 要 合适 无 论 哪 一 种 都 可 以 )。 这 3 个 常数 
定义 在 apue db.h 头 文件 中 。 如 果 使 用 DB INSERT 或 DB_STORE， 并 且 记 录 并 不 存在 ， 则 插 
入 一 条 新 记录 。 如 果 使 用 DB REPLACE 或 DB_STORE， 并 且 该 记录 已 经 存在 ， 则 用 新 记录 替换 已 
有 记录 。 如 果 使 用 DB_REPLACE， 而 记录 不 存在 ， 则 将 errno 设置 为 ENOENT， 返 回 值 为 -1， 并 
且 不 加 入 新 记录 。 如 果 使 用 DB_INSERT， 而 记录 已 经 存在 ， 则 不 插入 新 记录 ， 返 回 值 为 1。 在 这 
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里 ， 返 回 1 以 区 别 于 一 般 的 出 错 返回 〈 一 1)。 
通过 指定 键 key 可 以 从 数据 库 中 获取 一 条 记录 。 


#include "apue db.h" 





char *db fetch(DBHANDLE db, const char *key); 
返回 值 ， 若 成 功 ， 返 回 指向 数据 的 指针 ， 若 没有 找到 记录 ， 返 回 NULL 
如 果 找 到 了 记录 ,返回 指向 通过 key 存放 的 数据 的 指针 。 通 过 指定 ley， 也 可 以 在 数据 库 中 删 


#include "apue_db.h" 
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int db delete(DBHANDLE db, const char *key); 





除了 通过 指定 key 获取 记录 外 ， 还 可 以 逐条 记录 地 访问 数据 库 。 为 此 ， 首 先 调用 db rewind 
回 滚 到 数据 库 的 第 一 条 记录 ， 然 后 在 每 一 次 循环 中 调用 db_nextrec， 顺 序 地 读 每 条 记录 。 
#include "apue db.h" 
void db rewind(DBHANDLE db); 
char *db nextrec(DBHANDLE db, char *key); 
返回 值 ， 车 成 功 ， 返 回 指向 数据 的 指针 ; 若 到 达 数 据 库 文件 的 尾 端 ， 返 回 NULL 


如 果 key 是 非 空 指针 ，db_nextrec 将 这 个 指针 复制 到 存储 区 域 开始 的 内 存 位 置 ， 然 后 返回 
这 个 指针 。 

db_nextrec 不 保证 其 返回 记录 的 顺序 ， 只 保证 对 数据 库 中 的 每 一 条 记录 只 读 取 一 次 。 如 果 
顺序 存储 3 条 键 分 别 为 A. B. C 的 记录 ， 则 无 法 确定 do nextrec 将 按 什么 顺序 返回 这 3 Kid 
录 。 它 可 能 按 B、A、C 的 顺序 返回 ， 也 可 能 按 其 他 顺序 。 实 际 的 顺序 由 数据 库 的 实现 决定 。 

这 7 个 函数 提供 了 数据 库 函 数 库 的 接口 。 接 下 来 介绍 实现 。 
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访问 数据 库 的 函数 库 通 常 使 用 两 个 文件 来 存储 信息 : 一 个 索引 文件 和 一 个 数据 文件 。 索 引文 
件 包 括 实 际 的 索引 值 〈 键 》 和 一 个 指向 数据 文件 中 对 应 数据 记录 的 指针 。 有 许多 技术 可 用 来 组 织 
索引 文件 以 提高 按键 查询 的 速度 和 效率 ， 散 列表 和 B+ 树 是 两 种 常用 的 技术 。 我 们 采用 固定 大 小 
的 散 列表 来 组 织 索引 文件 结构 ， 并 采用 链表 法 解决 散 列 冲突 。 在 介绍 db_open 时 ， 曾 提 到 将 创 
建 两 个 文件 : 一 个 以 .idx 为 后 缀 的 索引 文件 和 一 个 以 .dat 为 后 级 的 数据 文件 。 

我 们 将 键 和 索引 以 null 结尾 的 字符 串 形式 存储 ， 它 们 不 能 包含 任意 的 二 进 制 数据 。 有 些 数 据 库 系统 
用 二 进 制 形式 存储 数值 数据 (如 用 1 个 、2 个 或 4 个 字 节 存储 一 个 整数 ) 以 节省 存储 空间 ， 这 样 一 来 使 
函数 复杂 化 ， 也 使 数据 库 文件 在 不 同 的 平台 间 移 植 比较 困难 。 例 如 ， 网 络 上 有 两 个 系统 使 用 不 同 的 二 进 
制 格式 存储 整数 ， 如 果 想 要 这 两 个 系统 都 能 够 访问 数据 库 ， 就 必须 解决 不 同 存储 格式 的 问题 〈 今 天 不 同 
体系 结构 的 系统 在 网 络 上 共享 文件 已 经 很 常见 了 )。 按 照 字符 串 形式 存储 所 有 的 记录 ,包括 键 和 数据 ， 能 
使 这 一 切 变 得 简单 。 这 确实 需要 使 用 更 多 的 磁盘 空间 ， 但 降低 了 获得 可 移植 性 需要 付出 的 代价 。 [746] 

db store 要 求 对 于 每 个 键 ， 只 有 一 条 对 应 的 记录 。 有 些 数据 库 系统 允许 多 条 记录 使 用 同样 
的 键 ， 并 提供 方法 访问 与 一 个 键 相关 的 所 有 记录 。 另 外 ， 我 们 只 有 一 个 索引 文件 ， 这 意味 着 每 个 
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数据 记录 只 能 有 一 个 键 〈 我 们 不 支持 次 键 )。 有 些 数据 库 允 许 一 条 记录 拥有 多 个 键 ， 并 且 对 每 一 
个 键 使 用 一 个 索引 文件 。 当 插入 或 删除 一 条 记录 时 ， 要 对 所 有 的 索引 文件 进行 相应 的 修改 。( 一 
个 拥有 多 个 索引 的 例子 是 员工 库 文件 。 可 以 将 员工 ID 作为 键 ， 也 可 以 将 员工 的 社会 保险 号 作为 
键 。 由 于 员工 的 名 字 并 不 保证 唯一 ， 所 以 名 字 不 能 作为 键 。) 















20-2 是 数据 库 实现 的 基本 结构 。 
空闲 链表 中 第 一条 
索引 记录 的 偏 移 量 
5 
pm 索引 记录 
I 
I 
该 散 列 链表 中 第 一 条 go? 
案 引 记录 的 偏 移 量 T. -- 
ge | 
"d 一 条 索引 记录 
一 I 
d 1 
| 5 RIS] 分 [数据 
E EX 记录 gt 隔 录 的 偏 | 隔 | 记 录 | \n 
= 3 长 度 符 | 移 量 | 符 | 长度 





该 散 列 链表 中 下 一 条 索引 记录 长 度 


索引 记录 的 偏 移 量 


数据 文件 ， | 


数据 记录 长 度 
图 20-2 索引 文件 和 数据 文件 结构 


索引 文件 由 3 部 分 组 成 : 空闲 链表 指针 、 散 列表 和 索引 记录 。 图 20-2 中 ， 所 有 指针 字段 中 实 
际 存储 的 是 ASCI 码 数字 形式 的 文件 偏 移 量 。 

当 给 定 一 个 键 ， 要 在 数据 库 中 寻找 一 条 记录 时 ，db_fetch 根据 该 键 计算 散 列 值 ， 由 此 散 列 
值 可 确定 一 条 散 列 链 (链表 指针 字段 可 以 为 0， 表 示 一 条 空 的 散 列 链 )。 沿 着 这 条 散 列 链 ， 可 以 找 
到 所 有 具有 这 一 散 列 值 的 索引 记录 。 当 遇 到 一 个 索引 记录 的 链表 指针 字段 为 0 时， 表示 到 达 了 此 
散 列 链 的 末尾 。 

下 面 来 看 一 个 实际 的 数据 库 文件 。 图 20-3 所 示 的 程序 建立 了 一 个 新 的 数据 库 ， 并 且 写 入 了 3 
条 记录 。 由 于 所 有 的 字段 都 以 ASCII 字符 的 形式 存储 在 数据 库 中 ， 所 以 可 以 用 任何 标准 的 UNIX 
系统 工具 来 查看 索引 文件 和 数据 文件 : 

$ 1s -1 db4.* 


-rw-r--r-- 1 sar 28 Oct 19 21:33 db4.dat 
-rw-r--r-- 1 sar 72 Oct 19 21:33 db4.idx 
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$ cat db4.idx 
0 53 35 0 
0 10Alpha:0:6 
0 10beta:6:14 
17 1llgamma:20:8 
$ cat db4.dat 
datal 
Data for beta 
record3 


为 了 使 这 个 例子 紧凑 ， 将 每 个 指针 字段 的 大 小 设置 为 4 个 ASCIL 字符 ， 将 散 列 链 的 数量 设置 为 3 
条 。 由 于 每 一 个 指针 中 记录 的 是 一 个 文件 偏 移 量 ， 所 以 4 个 ASCI 字符 限制 了 一 个 索引 文件 或 数 
据 文 件 的 大 小 最 多 只 能 为 10000 字 节 。 当 在 20.9 节 做 性 能 测试 时 , 将 指针 字段 的 大 小 设 为 6 个 字 
符 ( 这 样 文件 大 小 可 以 达到 1000000 字 节 )， 将 散 列 链 数 量 设 为 100。 

#include "apue.h" 


#include "apue db.h" 
#include «fcntl.h» 





int 
main(void) 
{ 
DBHANDLE db; 


if ((db = db_open("db4", O_RDWR | O_CREAT | O_TRUNC, 
FILE_MODE)) == NULL) 
err sys("db open error"); 


if (db store(db, "Alpha", "datal", DB INSERT) !- 0) 
err quit("db store error for alpha"); 

if (db store(db, "beta", "Data for beta", DB INSERT) != 0) 
err quit("db store error for beta"); 

if (db store(db, "gamma", "record3", DB INSERT) !- 0) 


err quit("db store error for gamma"); 


db close (db); 
exit(0); 


图 20-3 建立 一 个 数据 库 并 写 入 3 条 记录 

索引 文件 的 第 一 行为 : 

0 53 35 0 
分 别 为 空闲 链表 指针 CO 表示 空闲 链表 为 空 》 和 3 个 散 列 链 的 指针 : 53. 35 和 0。 下 一 行 : 

0 10Alpha:0:6 
显示 了 一 条 索引 记录 的 结构 。 第 一 个 4 字符 字段 CO) 为 链表 指针 ， 表 示 这 一 条 记录 是 此 散 列 链 的 
最 后 一 条 。 下 一 个 4 字符 字段 (10) 为 idx len (索引 记录 长 度 )， 表 示 此 索引 记录 剩余 部 分 的 长 度 。 
用 两 个 read 操作 来 读 取 一 条 索引 记录 : 第 一 个 read 读 取 这 两 个 固定 长 度 的 字段 BAHAR 
引 记 录 长 度 )， 然 后 再 根据 索引 记录 长 度 来 读 取 后 面 的 不 定 长 部 分 。 剩 下 的 3 个 字段 为 : 键 、 数 据 记 
录 的 偏 移 量 和 数据 记录 的 长 度 。 这 3 个 字段 用 分 隔 符 隔 开 ， 此 处 使 用 的 分 隔 符 是 冒号 。 由 于 这 3 
个 字段 都 是 不 定 长 的 ， 所 以 需要 一 个 专门 的 分 隔 符 ， 而 且 这 个 分 隔 符 不 能 出 现在 键 中 。 最 后 用 一 个 
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\n GRIT) 结束 这 一 条 索引 记录 。 由 于 在 索引 记录 长 度 字 段 中 已 经 有 了 记录 的 长 度 ， 所 以 这 个 
换行 符 并 不 是 必需 的 ， 加 上 换行 符 是 为 了 把 各 条 索引 记录 分 开 ， 这 样 就 可 以 用 标准 的 UNIX 系统 工 
A (如 cat 和 more) 来 查看 索引 文件 。 键 字段 是 将 记录 写 入 数据 库 时 指定 的 值 。 数 据 记 录 在 数据 
文件 中 的 偏 移 量 为 0， 长 度 为 6。 从 数据 文件 中 可 看 到 数据 记录 确实 从 0 开始 ， 长 度 为 6 个 字 节 。 (与 
索引 文件 一 样 ， 这 里 自动 在 每 条 数据 记录 的 后 面 追加 一 个 换行 符 ， 以 便于 使 用 UNIX 系统 工具 。 在 
调用 db_fetch 时 ， 此 换行 符 不 作为 数据 返回 。) 

如 果 在 这 个 例子 中 跟踪 3 条 散 列 链 ， 可 以 看 到 第 一 条 散 列 链 上 第 一 条 记录 的 偏 移 量 是 53 
(gamma)。 这 条 链 上 下 一 条 记录 的 偏 移 量 为 17 (alpha)， 并 且 是 这 条 链 上 的 最 后 一 条 记录 。 
第 二 条 散 列 链 上 的 第 一 条 记录 的 偏 移 量 是 35 (beta)， 且 是 此 链 上 最 后 一 条 记录 。 第 三 条 散 列 
链 为 空 。 

请 注意 ， 索 引文 件 中 键 的 顺序 和 数据 文件 中 对 应 数据 记录 的 顺序 与 图 20-3 程序 中 调用 db_ 
store 的 顺序 一 样 。 由 于 在 调用 do open 时 使 用 了 0_TRUNC 标志 , 索引 文件 和 数据 文件 都 被 截 
断 了 ， 整 个 数据 库 相 当 于 重新 初始 化 。 在 这 种 情况 下 ，db_store 将 新 的 索引 记录 和 数据 记录 追 
加 到 对 应 的 文件 末尾 。 后 面 将 看 到 ，db_store 还 可 以 重复 使 用 这 两 个 文件 中 已 删除 记录 原来 对 
应 的 空间 。 

使 用 固定 大 小 的 散 列 表 作 为 索引 是 一 个 妥协 。 当 每 个 散 列 链 都 不 太 长 时 ， 这 个 方法 能 保证 快 

748| 速 地 访问 。 我 们 的 目的 是 能 够 快速 地 查找 任 一 键 ， 同 时 又 不 使 用 太 复 杂 的 数据 结构 (如 B 树 或 动 
749| 态 散 列 表 )。 动 态 散 列表 的 优点 是 能 保证 仅 用 两 次 磁盘 存 取 就 能 找到 数据 记录 《〈 详 见 Litwin[1980] 

或 Fagin 等 [1979])。B 树 能 够 用 (已 排序 的 ) 键 的 顺序 来 遍历 数据 库 (采用 散 列 表 的 db_nextrec 
函数 就 做 不 到 这 一 点 )。 


20.5 ”集中 式 或 非 集中 式 


当 有 多 个 进程 访问 同一 数据 库 时 ， 有 两 种 方法 可 实现 库 函 数 。 

C1) 集中 式 。 由 一 个 进程 作为 数据 库 管 理 者 ， 所 有 的 数据 库 访问 工作 由 此 进程 完成 。 其 他 进 
程 通过 IPC 机 制 与 此 中 心 进程 进行 联系 。 

(2) 非 集中 式 。 每 个 库 函 数 使 用 要 求 的 并 发 控制 (加 锁 )， 然 后 发 起 自己 的 VO 函数 调用 。 

使 用 这 两 种 技术 的 数据 库 系统 都 有 。 如 果 有 适当 的 加 锁 例 程 ， 因 为 避免 了 使 用 IPC, ABAAE 

集中 式 方 法 一 般 要 快 一 些 。 图 20-4 描绘 了 集中 式 方 法 的 操作 。 

图 中 特意 表示 出 IPC 像 绝 大 多 数 UNIX 系统 的 消息 传递 一 样 需要 经 过 操作 系统 内 核 (15.9 节 
中 说 明 的 共享 存储 不 需要 这 种 经 过 内 核 的 复制 )。 在 集中 方式 下 ， 中 心 控制 进程 将 记录 读 出 ， 然 
后 通过 IPC 机 制 将 数据 传递 给 请 求 进程 。 这 是 这 种 设计 的 不 足 之 处 。 注意 ， 集 中 式 数据 库 管理 进 
程 是 唯一 对 数据 库 文 件 进行 VO 操作 的 进程 。 

集中 式 的 优点 是 能 够 根据 需要 来 对 操作 模式 进行 调整 。 例 如 ， 可 以 通过 中 心 进 程 给 不 同 的 进 
程 赋予 不 同 的 优先 级 ， 这 会 影响 到 中 心 进程 对 VO 操作 的 调度 。 而 用 非 集中 式 方 法 则 很 难 做 到 这 
一 点 。 在 这 种 情况 下 ， 只 能 依赖 于 操作 系统 内 核 的 磁盘 VO 调度 策略 和 加 锁 策 略 〈 例 如 ， 当 3 个 
进程 同时 等 待 一 个 即将 可 用 的 锁 时 ， 我 们 无 法 确定 哪个 进程 将 得 到 这 个 锁 )。 

集中 式 方 法 的 另 一 个 优点 是 ， 恢 复 要 比 非 集中 式 方法 容易 。 在 集中 式 方 法 中 ， 所 有 状态 信息 
都 集中 存放 在 一 处 ， 所 以 如 若 杀 死 了 数据 库 进程 ， 只 需 在 该 处 查看 以 识别 出 需要 解决 的 未 完成 事 
务 ， 然 后 将 数据 库 恢 复 到 一 致 状态 。 
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用 户 进程 用 户 进程 用 户 进程 


数据 库 访 
UL: E dd 






WE 


图 20-4 集中 式 数 据 库 访问 


图 20-5 描绘 了 非 集中 式 方法 ， 本 章 的 实现 就 是 采用 这 种 方法 。 
用 户 进程 用 户 进 程 








图 20-5” 非 集中 式 数 据 库 访 问 [751] 
调用 数据 库 库 函 数 执行 IO 的 用 户 进程 是 合作 进程 , 它们 使 用 字 节 范围 记录 锁 机 制 来 实现 并 发 控制 。 
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20.6 并 发 


由 于 很 多 系统 的 实现 都 采用 两 个 文件 〈 一 个 索引 文件 和 一 个 数据 文件 ) 的 方法 ， 所 以 在 此 也 
使 用 这 种 方法 ， 这 要 求 能 够 控制 对 两 个 文件 的 加 锁 。 有 很 多 方法 可 用 来 对 两 个 文件 进行 加 锁 。 

1. 粗 粒度 锁 

最 简单 的 加 锁 方 法 是 将 这 两 个 文件 中 的 一 个 作为 整个 数据 库 的 锁 ， 并 要 求 调 用 者 在 对 数据 库 
进行 操作 前 必须 获得 这 个 锁 。 这 种 加 锁 方 式 称 为 粗 粒度 锁 〈coarse-grained locking)。 例 如 ， 可 以 
认为 一 个 进程 对 索引 文件 的 0 字 节 加 了 读 锁 后 ， 才 能 读 整 个 数据 库 ; 一 个 进程 对 索引 文件 的 0 F 
节 加 了 写 锁 后 ， 就 能 写 整个 数据 库 。 可 以 使 用 UNIX 系统 的 字 节 范围 锁 机 制 来 控制 每 次 可 以 有 多 
个 读 进 程 ， 而 只 能 有 一 个 写 进程 〈 见 图 14-3). db_fetch 和 db_nextrec 函数 要 求 具有 读 锁 ， 
而 db delete. db store 和 db_open MERKRA SM. (db open 要 求 写 锁 的 原因 是 如 果 要 
创建 新 文件 的 话 ， 要 在 索引 文件 前 端 建立 空闲 区 链表 以 及 散 列 链表 。) 

粗 粒 度 锁 的 问题 是 它 限制 了 并 发 。 用 粗 粒 度 锁 时 ， 当 一 个 进程 向 一 条 散 列 链 中 添加 一 条 记录 
时 ， 其 他 进程 无 法 访问 另 一 条 散 列 链 上 的 记录 。 

2. 细 粒度 锁 

$0 #3 FE 4 (fine-grained locking) 的 方法 改进 了 粗 粒 度 锁 ， 提 供 了 更 高 的 并 发 性 。 一 个 读 进程 
或 写 进程 在 操作 一 条 记录 前 必须 先 获得 此 记录 所 在 散 列 链 的 读 锁 或 写 锁 。 一 条 散 列 链 允 许 同 时 有 
多 个 读 进程 ， 但 只 能 有 一 个 写 进程 。 其 次 ， 一 个 写 进程 在 访问 空闲 区 链表 (如 do delete 或 
db store) 前 ， 必 须 获 得 空闲 区 链表 的 写 锁 。 最 后 ， 当 db_store 向 索引 文件 或 数据 文件 末尾 
追加 一 条 新 记录 时 ， 必 须 获 得 对 应 文件 相应 区 域 的 写 锁 。 

期 望 细 粒度 锁 能 比 粗 粒度 锁 能 提供 更 高 的 并 发 性 。20.9 节 将 给 出 一 些 实际 的 比较 测试 结 
Ht. 20.8 节 给 出 了 细 粒 度 锁 实现 的 源 代码 ， 并 讨论 锁 的 实现 细节 〈( 粗 粒度 锁 是 这 个 细 粒 度 锁 实 
现 的 简化 )。 

在 源 代码 中 ， 直 接 调用 了 read. readv. write 和 writev。 没 有 使 用 标准 VO 函数 库 。 
虽然 使 用 标准 IO 函数 库 也 可 以 使 用 字 节 范围 锁 , 但 是 需要 非常 复杂 的 缓冲 管理 。 例如， 标准 IO 
缓冲 区 的 数据 在 5 分 钟 之 前 被 另 一 个 进程 修改 了 ， 那 么 我 们 就 不 希望 fgets 返回 的 数据 是 10 分 
钟 之 前 读 入 标准 IO 缓冲 区 的 数据 。 

以 上 对 并 发 的 讨论 依据 的 是 对 数据 库 函 数 库 的 简单 需求 。 商 业 系统 一 般 有 更 多 的 需要 。 关 于 
并 发 更 多 的 细节 可 以 参见 Data[2004] 的 第 16 章 。 


20.7 ”构造 函数 库 


数据 库 的 函数 库 由 两 个 文件 构成 ,一 个 公用 的 C 头 文件 以 及 一 个 C 源 文 件 。 我 们 可 以 用 下 列 
命令 构造 一 个 静态 函数 库 。 


gcc -I../include -Wall -c db.c 
ar rsv libapue db.a db.o 


因为 我 们 在 数据 库 函 数 库 中 使 用 了 一 些 我 们 自己 的 公共 函数 ， 所 以 希望 与 libapue db.a 相连 接 
的 应 用 程序 也 需要 与 libapue.a 相连 接 。 
另 一 方面 ， 如 果 想 构建 数据 库 函 数 库 的 动态 共享 库 版 本 ， 可 使 用 下 列 命令 : 
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gcc -I../include -Wall -fPIC -c db.c 
gcc -shared -Wl,-soname,libapue db.so.1 -o libapue db.so.1 \ 
-L../lib -lapue -lc db.o 


构建 成 的 共享 库 libapue db.so.1 需 放 置 在 动态 连接 程序 / 载 入 程序 (dynamic linker/loader) 能 
够 找到 的 一 个 公用 目录 中 。 还 可 以 将 共享 库 放 置 在 一 个 私有 目录 中 ， 修 改 LD_LIBRARY_PATH 环境 
变量 ， 使 动态 连接 程序 / 载 入 程序 的 搜索 路 径 包 含 该 私有 目录 。 


在 不 同 平台 间 ， 构 建 共享 库 的 步骤 会 有 所 不 同 。 这 里 说 明 的 步骤 是 在 带 GNU C 编译 器 的 Linux 
系统 中 进行 的 。 


20.8 源 代码 


本 节 解 释 我 们 编写 的 数据 库 函 数 库 源 代码 ， 先 从 头 文件 apue_db.h 开始 。 函 数 库 源 代码 以 
及 调用 此 函数 库 的 所 有 应 用 程序 都 包含 这 一 头 文件 。 

从 此 处 开始 ， 实 例 程序 的 编排 方式 在 很 多 方面 与 前 面 的 实例 程序 编排 有 所 不 同 。 首 先 ， 因 为 
源 代码 较 长 ， 为 此 加 了 行 号 ， 这 使 得 通过 行 号 联系 相应 的 源 代码 进行 讨论 更 加 方便 。 其 次 ， 对 源 
代码 的 说 明 紧 随 相 关 源 代码 之 后 。 


这 种 风格 受到 John Lions 解释 UNIX V6 操作 系统 源 代 码 的 书 [Lions 1977, 1996] 的 影响 ， 这 使 


得 解释 说 明 大 量 源 代 码 更 为 简易 。 
注意 ， 此 处 对 空白 行 不 编号 。 虽 然 某 些 工 具 〈 如 pr(1)) 的 正常 操作 与 这 些 空白 行 是 有 关 的 ， 
但 是 我 们 对 它们 并 无 任何 兴趣 。 


1 #ifndef _APUE_DB_H 
2 #define _APUE_DB_H 


3 typedef void * DBHANDLE; 


4 DBHANDLE db open(const char *, int, ...); 

5 void db close (DBHANDLE) ; 

6 char *db fetch(DBHANDLE, const char *); 

T int db store(DBHANDLE, const char *, const char *, int); 
8 int db delete(DBHANDLE, const char *); 

9 void db rewind (DBHANDLE) ; 

10 char *db nextrec(DBHANDLE, char *); 

11 /* 

12 * Flags for db store(). 

13 #7 

14 #define DB INSERT 1 /* insert new record only */ 

15 #define DB REPLACE 2 /* replace existing record */ 

16 #define DB STORE 3 /* replace or insert */ 

ET y7 

18 * Implementation limits. 

19  */ 

20 #define IDXLEN MIN 6 /* key, sep, start, sep, length, Mn */ 


21 #define IDXLEN MAX 1024 /* arbitrary */ 
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22 #define DATLEN_MIN 2 /* data byte, newline */ 
23 #define DATLEN_MAX 1024 /* arbitrary */ 
24 endif /* _APUE_DB_H */ 


[1 一 3] 使 


用 


[4— 10] TE 


= 


[11—24] Æ 


ou f& WN Fe 


10 
11 
12 
13 
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15 


16 
17 
18 
19 
20 
21 
22 
23 
24 


25 
26 


[1~6] 


x 
最 


用 符号 _APUE_DB_H 以 保证 只 包括 该 头 文件 一 次 。 DBHANDLE 类 型 表示 对 数据 库 的 
个 有 效 引 用 ， 用 于 隔离 应 用 程序 和 数据 库 的 实现 细节 。 将 此 技术 与 标准 IO 库 向 应 
程序 提供 PILE 结构 相 比 较 ， 两 者 相似 。 

着 ， 声 明了 数据 库 函 数 库 公 有 函数 的 原型 。 因 为 使 用 函数 库 的 应 用 程序 包括 了 此 头 
件 ， 所 以 这 里 不 再 声明 函数 库 私 有 函数 的 原型 。 

义 了 可 以 传送 给 db store 函数 的 合法 标志 。 其 后 是 实现 的 基本 限制 。 如 果 希 望 
持 更 大 的 数据 库 ， 可 以 更 改 这 些 限制 。 

小 索引 记录 长 度 由 IDXLEN_MIN 指定 。 这 表示 1 字 节 键 、1 字 节 分 隔 符 、!1 字 节 起 


始 偏 移 量 ， 另 一 个 1 字 节 分 隔 符 、!1 字 节 长 度 和 终止 换行 符 。( 回 忆 图 20-2 中 索引 记 


录 


的 格式 。) 一 条 索引 记录 通常 长 于 IDXLEN MIN 字 节 ， 这 只 是 最 小 长 度 。 


下 一 个 文件 是 db .c， 它 是 库 函 数 的 C 源 文件 。 为 简化 起 见 ， 将 所 有 函数 都 放 在 一 个 文件 中 。 
这 样 处 理 的 优点 是 只 要 将 私有 函数 声明 为 static， 就 可 对 外 将 它 隐 蔽 起 来 。 


#include 
#include 
#include 
#include 
#include 
#include 


/* 


"apue.h" 

"apue db.h" 

«fcntl.h» /* open & db open flags */ 
<stdarg.h> 

<errno.h> 

<sys/uio.h>  /* struct iovec */ 


* Internal index file constants. 


* These 
* index 
*/ 

define 
#define 
#define 
#define 


/* 


are used to construct records in the 

file and data file. 

IDXLEN_SZ 4 /* index record length (ASCII chars) */ 
SEP at /* separator char in index record */ 
SPACE ae /* space character */ 

NEWLINE '\n' /* newline character */ 


* The following definitions are for hash chains and free 
* list chain in the index file. 


ar A 
#define 
#define 
#define 
#define 
#define 


typedef 
typedef 


PTR_SZ 7 /* size of ptr field in hash chain */ 
PTR MAX 999999 /* max file offset - 10**PTR SZ - 1 */ 
NHASH DEF 137 /* default hash table size */ 

FREE OFF 0 /* free list offset in index file */ 
HASH OFF PTR SZ /* hash table offset in index file */ 


unsigned long DBHASH; /* hash values */ 
unsigned long COUNT; /* unsigned counter */ 


使 用 了 一 些 私 有 函数 库 中 的 函数 ， 所 以 程序 中 包括 了 apue.h. "34A, apue.h 也 包 


括 若干 标准 头 文件 ， 包 括 <stdio.h> 和 <unistd.h>。 因 为 db open 函数 使 用 由 
<stdarg.h> 定 义 的 可 变 参 数 函数 ， 所 以 程序 中 也 包括 了 <stdarg.h>。 
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[7 一 26] ”索引 记录 的 长 度 说 明 为 IDXLEN_SZ。 我 们 用 某 些 字符 〈 如 冒号 、 换 行 符 ) 作为 数据 
库 中 的 分 隔 符 。 当 删除 一 记录 时 ， 在 其 中 全 部 填 入 空格 符 。 
其 中 一 些 定义 为 常量 的 值 也 可 定义 为 变量 ， 只 是 会 使 实现 复杂 一 些 。 例 如 ， 设 定 散 列 
表 的 大 小 为 137 记录 项 ， 也 许 更 好 的 方法 是 让 db_open 的 调用 者 根据 预期 的 数据 库 
大 小 通过 参数 来 设 定 这 个 值 ， 然 后 将 该 值 存在 索引 文件 的 最 前 面 。 

27  /* 

28 *Library's private representation of the database. 

29 */ 

30 typedef struct { 

31 int idxfd; /* fd for index file */ 

32 int datfd; /* fd for data file */ 

33 char *idxbuf; /* malloc'ed buffer for index record */ 

34 char *datbuf; /* malloc'ed buffer for data record*/ 

35 char *name; /* name db was opened under */ 

36 off t idxoff; /* offset in index file of index record */ 

37 /* key is at (idxoff + PTR SZ + IDXLEN SZ) */ 

38 size t idxlen; /* length of index record */ 

39 /* excludes IDXLEN SZ bytes at front of record */ 

40 /* includes newline at end of index record */ 

41 off t datoff; /* offset in data file of data record */ 

42 size t datlen; /* length of data record */ 

43 /* includes newline at end */ 

44 off t ptrval; /* contents of chain ptr in index record */ 

45 off.t ptxoff: /* chain ptr offset pointing to this idx record */ 

46 off t chainoff; /* offset of hash chain for this index record */ 

47 off t hashoff; /* offset in index file of hash table */ 

48 DBHASH nhash; /* current hash table size */ 

49 COUNT cnt delok; /* delete OK */ 

50 COUNT cnt delerr; /* delete error */ 

51 COUNT cnt fetchok; /* fetch OK */ 

52 COUNT cnt fetcherr; /* fetch error */ 

53 COUNT cnt nextrec; /* nextrec */ 

54 COUNT cnt storl; /* store: DB INSERT, no empty, appended */ 

55 COUNT cnt stor2; /* store: DB INSERT, found empty, reused */ 

56 COUNT cnt stor3; /* store: DB REPLACE, diff len, appended */ 

51 COUNT cnt stor4; /* store: DB REPLACE, same len, overwrote */ 

58 COUNT cnt storerr; /* store error */ 

59 ) DB; 

[277—48] ”在 DB 结构 中 记录 一 个 打开 数据 库 的 所 有 信息 。db_open 函数 返回 DB 结构 的 指针 
DBHANDLE 值 。 这 个 指针 被 用 于 其 他 所 有 函数 ， 而 该 结构 本 身 则 不 面向 调用 者 。 
因为 在 数据 库 中 以 ASCII 形式 存放 指针 和 长 度 ， 所 以 将 这 些 转换 为 数字 值 ， 并 存放 
在 DB 结构 中 。 也 存放 散 列 表 长 度 ， 虽然 一 般 而 言 ， 这 是 定 长 的 , 但 也 有 可 能 为 加 强 
该 函数 库 ， 人 允许 调用 者 在 创建 数据 库 时 指定 该 长 度 〈 见 习题 20.7)。 

[49 一 59] B 结构 的 最 后 10 个 字段 对 成 功 和 不 成 功 的 操作 进行 计数 。 如果 想 要 分 析 数 据 库 的 性 能 ， 
则 可 编写 一 个 函数 返回 这 些 统计 值 。 但 目前 我 们 仅 保持 这 些 计数 器 ， 并 未 编写 此 种 函数 。 

60 Z* 

61 *Internal functions. 

62 */ 

63 static DB * db alloc(int); 
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64 static void _db dodelete(DB *); 

65 static int _db_find_and_lock(DB *, const char *, int); 

66 static int _db findfree(DB *, int, int); 

67 static void .db free(DB *); 

68 static DBHASH db hash(DB *, const char *); 

69 static char * db readdat(DB *); 

70 static off t | db readidx(DB *, off t); 

71 static off t | db readptr(DB *, off t); 

72 static void _db writedat(DB *, const char *, off t, int); 

73 static void .db writeidx(DB *, const char *, off t, int, off t); 

74 static void .db writeptr(DB *, off t, off t); 

75 7* 

76 *Open or create a database. Same arguments as open(2). 

77 */ 

78 DBHANDLE 

79 db open(const char *pathname, int oflag, ...) 

80 { 

81 DB *db; 

82 int len, mode; 

83 size t i; 

84 char asciiptr[PTR SZ + 1], 

85 hash[(NHASH DEF + 1) * PTR SZ + 2]; 

86 /* *2 for newline and null */ 

87 struct stat statbuff; 

88 gx 

89 * Allocate a DB structure, and the buffers it needs. 

90 rd 

91 len = strlen (pathname); 

92 if ((db = db alloc(len)) == NULL) 

93 err dump("db open: db alloc error for DB"); 

[60—74] ”选择 用 db_ 开 头 来 命名 用 户 可 调用 (公有 ) 的 所 有 函数 ,用 _db_ 开 头 来 命名 内 部 〈 私 
有 ) 函数 。 公 有 函数 在 函数 库 头 文件 apue_db .nh 中 声明 。 内 部 函数 声明 为 static, 
所 以 只 有 同一 文件 中 的 其 他 函数 才能 调用 它们 该 文件 包含 函数 库 实现 )。 

[75—93] db open 函数 的 参数 与 open(2) 相 同 。 如 果 调 用 者 想 要 创建 数据 库 文 件 ， 那 么 用 可 选 
择 的 第 三 个 参数 指定 文件 权限 。db_open 函数 打开 索引 文件 和 数据 文件 ， 在 必要 时 初 
始 化 索引 文件 。 该 函数 调用 _db_alloc 来 为 DB 结构 分 配 空间 ， 并 初始 化 此 结构 。 

94 db->nhash = NHASH DEF;/* hash table size */ 

95 db->hashoff = HASH_OFF; /* offset in index file of hash table */ 

96 strcpy (db->name, pathname); 

97 strcat (db->name, ".idx"); 

98 if (oflag & O_CREAT) { 

99 va_list ap; 

100 va start(ap, oflag); 

101 mode - va arg(ap, int); 

102 va end(ap); 

103 rs 

104 * Open index file and data file. 
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105 =f 

106 db->idxfd = open(db->name, oflag, mode); 
107 strcpy(db-»name + len, ".dat"); 

108 db->datfd = open(db-»name, oflag, mode); 
109 ) else { 

110 p 

111 * Open index file and data file. 

112 */ 

113 db->idxfd = open(db->name, oflag); 

114 strcpy (db->name + len, ".dat"); 

115 db->datfd = open(db->name, oflag); 

116 ) 

117 if (db->idxfd < 0 || db->datfd < 0) { 

118 _db_free (db) ; 

119 return (NULL) ; 

120 } 


[94~97] 继续 初始 化 DB 结构 。 调 用 者 传 入 的 路 径 名 指定 数据 库 文件 名 的 前 缀 。 追 加 后 


Zi idx 以 构成 数据 库 索 引文 件 的 名 字 。 

[98 一 108] 如 果 调 用 者 想 要 创建 数据 库 文件 ， 那 么 使 用 <stdarg.h> 中 的 可 变 参 数 函 数 以 找 
到 可 选 的 第 三 个 参数 。 然 后 ， 使 用 open 创建 并 打开 索引 文件 和 数据 文件 。 注 意 ， 
数据 文件 的 文件 名 以 索引 文件 同样 的 前 组 开始 ， 但 后 缀 为 .dat。 

[109 一 116] ”如 果 调 用 者 没有 指定 0_CREAT 标志 ， 那 么 正在 打开 已 有 的 数据 库 文件 。 此 时 ， 只 
用 两 个 参数 调用 open。 

[117 一 120] ”如 果 在 打开 或 创建 任 一 数据 库 文件 时 出 错 ， 则 调用 _db_free 清除 DB 结构 ， 然 后 
对 调用 者 返回 NULL。 如 果 一 个 文件 open 成 功 而 另 一 个 失败 ，_db_free 将 关闭 
该 打开 文件 描述 符 。 我 们 很 快 就 会 见 到 这 一 操作 。 


121 if ((oflag & (O_CREAT | O_TRUNC)) == (O_CREAT | O_TRUNC)) { 
122 y% 

123 * If the database was created, we have to initialize 
124 * it. Write lock the entire file so that we can stat 
125 * it, check its size, and initialize it, atomically. 
126 aid 

127 if (writew_lock(db->idxfd, 0, SEEK SET, 0) < 0) 

128 err dump("db open: writew_lock error"); 

129 if (fstat(db-»idxfd, &statbuff) < 0) 

130 err sys("db open: fstat error"); 

131 if (statbuff.st size == 0) { 

132 /5 

133 * We have to build a list of (NHASH DEF + 1) chain 
134 * ptrs with a value of 0. The +1 is for the free 
135 * list pointer that precedes the hash table. 

136 */ 

137 sprintf(asciiptr, "$*d", PTR SZ, 0); 


[121—130] ”如 果 正 在 建立 数据 库 ， 则 必须 正确 地 加 锁 。 考 虑 两 个 进程 试图 同时 建立 同一 个 数 


据 库 的 情况 。 第 一 个 进程 运行 到 调用 fstat， 并 且 在 fstat 返回 后 被 内 核 阻塞 。 
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这 时 第 二 个 进程 调用 db open， 发 现 索 引文 件 的 长 度 为 0， 然 后 初始 化 空闲 链表 
和 散 列 链表 。 第 二 个 进程 继续 运行 ， 向 数据 库 中 写 入 了 一 条 记录 。 这 时 第 二 个 进 
程 被 阻塞 ， 第 一 个 进程 在 调用 fstat 后 立刻 继续 运行 ， 它 发 现 索 引文 件 的 长 度 为 
0 因为 第 一 个 进程 调用 fstat 在 前 ， 然 后 第 二 个 进程 再 初始 化 索引 文件 )， 所 以 
第 一 个 进程 重新 初始 化 空闲 链表 和 散 列 链表 , 第 二 个 进程 写 入 的 记录 就 被 抹 去 了 。 
避免 发 生 这 种 情况 的 方法 是 进行 加 锁 ， 为 此 可 以 使 用 14.3 节 中 的 readw_lock, 
writew lock 和 un lock 这 3 个 宏 。 


[131—137] 如果 索引 文件 的 长 度 是 0， 那 么 这 是 刚刚 被 创建 的 ， 所 以 需要 初始 化 它 所 包含 的 
空闲 列表 指针 和 散 列 链 指针 。 注 意 ， 使 用 格式 字符 串 sxd 将 数据 库 指针 从 整 型 转 
换 为 ASCI 字符 串 。( 在 _dqb_writeidx Al_db_writeptr 中 还 将 使 用 这 种 格式 
字符 串 。) 这 一 格式 告诉 sprintf W PTR sz 参数 ， 用 它 作 为 下 一 个 参数 的 最 小 
字段 宽度 ， 在 此 例 中 ， 它 是 0 〈 此 处 ， 因 为 正在 创建 一 数据 库 ， 所 以 将 指针 初始 
化 为 0)。 其 作用 是 强迫 创建 的 字符 串 至 少 包含 PTR SZ 个 字符 (在 左边 用 空格 充 
H). TE db writeidx fW db writeptr 中 ， 将 传送 一 个 非 0 指针 值 ， 但 是 首 
先 将 验证 指针 值 不 大 于 PTR_MAX， 以 保证 写 入 数据 库 的 指针 字符 串 恰 好 为 
PTR_SZ(7) 个 字符 。 

138 hash[0] = 0; 

139 for (i = 0; i < NHASH_DEF + 1; i++) 

140 strcat (hash, asciiptr); 

141 strcat (hash, "\n"); 

142 i = strlen(hash); 

143 if (write (db->idxfd, hash, i) != i) 

144 err_dump("db_open: index file init write error"); 

145 } 

146 if (un_lock(db->idxfd, 0, SEEK_SET, 0) < 0) 

147 err dump("db open: un lock error"); 

148 ) 

149 db rewind (db); 

150 return (db); 

DRK $ 

152 /* 

153 * Allocate & initialize a DB structure and its buffers. 

154  */ 

155 static DB * 

156 db alloc(int namelen) 

157 1 

158 DB *db; 

159 /* 

160 * Use calloc, to initialize the structure to zero. 

161 ay 

162 if ((db = calloc(1, sizeof(DB))) == NULL) 

163 err dump(" db alloc: calloc error for DB"); 

164 db->idxfd = db->datfd = -1; /* descriptors */ 

165 /* 


* Allocate room for the name. 
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167 * +5 for ".idx" or ".dat" plus null at end. 

168 * 

169 if ((db->name = malloc(namelen + 5)) == NULL) 

170 err dump(" db alloc: malloc error for name"); 

[138—151] ”继续 初始 化 新 创建 的 数据 库 。 构 造 散 列表 ， 将 它 写 到 索引 文件 中 。 然 后 ， 解 锁 索 
引文 件 , 重 管 数据 库 文件 指针 ,返回 DB 结构 指针 作为 句柄 ， 以 便 调 用 者 以 后 用 于 
其 他 数据 库 函 数 。 

[152~164] | db open 调用 函数 db alloc 为 DB 结构 分 配 空间 , 包括 一 个 索引 缓冲 区 和 一 个 
数据 缓冲 区 。 用 calloc 分 配 存储 区 来 存放 DB 结构 ， 并 将 该 存储 区 各 存储 单元 . 
全 部 初始 化 为 0。 这 产生 了 一 个 副作用 ， 也 就 是 将 数据 库 文件 描述 符 也 设置 为 0， 
为 此 需 将 它们 重新 设置 为 一 1， 表 示 它 们 至 此 还 不 是 有 效 的 。 

[165 一 170] ”分 配 空间 以 存放 数据 库 索 引文 件 和 数据 文件 的 名 字 。 如 db open 中 所 说 明 的 那 
样 ， 更 改 它们 的 名 字 后 缀 以 便 引 用 索引 文件 或 数据 文件 。 

LT yt 

172 * Allocate an index buffer and a data buffer. 

173 * +2 for newline and null at end. 

174 *4 

175 if ((db-»idxbuf = malloc(IDXLEN MAX + 2)) -- NULL) 

176 err dump(" db alloc: malloc error for index buffer"); 

177 if ((db->datbuf = malloc(DATLEN MAX + 2)) == NULL) 

178 err dump(" db alloc: malloc error for data buffer"); 

179 return (db); 

180 ) 

181 /* 

182 * Relinquish access to the database. 

183  */ 

184 void 

185 db close(DBHANDLE h) 

186 { 

187 .db free((DB *)h); /* closes fds, free buffers & struct */ 

188 ) 

189 /* 


190 * Free up a DB structure, and all the malloc'ed buffers it 
191 * may point to. Also close the file descriptors if still open. 


192. ^ 


193 static void 
194 db free(DB *db) 


195 { 

196 if (db->idxfd >= 0) 

197 close (db->idxfd); 

198 if (db->datfd >= 0) 

199 close (db->datfd) ; 

[171 一 180] “为 索引 文件 和 数据 文件 的 缓冲 区 分 配 空 间 。 索 引 缓冲 区 和 数据 缓冲 区 的 大 小 在 


apue db.h 中 定义 。 可 以 通过 让 这 些 缓冲 区 按 需 要 动态 扩张 来 增强 数据 库 函 数 
库 。 其 方法 可 以 是 记录 这 两 个 缓冲 区 的 大 小 ， 然 后 在 需要 更 大 的 缓冲 区 时 调用 
realloc。 最 后 ， 返 回 指 向 已 分 配 到 的 DB 结构 的 指针 。 
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[181 一 188] 


[189~199] 


db close 函数 只 是 一 个 包装 ， 它 将 数据 库 句 柄 强制 类 型 转换 为 DB 结构 的 指针 ， 
将 它 传送 给 db free 函数 ， 由 该 函数 释放 资源 以 及 DB 结构 。 

db open 在 打开 索引 文件 和 数据 文件 时 如 果 发 生 错 误 ， 会 调用 db free 函数 释 
放 资 源 。 应 用 程序 在 结束 对 数据 库 的 使 用 后 ，db_close 也 会 调用 _db_free。 如 
果 数 据 库 索引 文件 的 文件 描述 符 有 效 ， 那 么 关闭 该 文件 。 对 数据 文件 描述 符 也 进 
行 同样 处 理 。( 回 忆 在 _db_alloc 中 分 配 一 个 新 的 DB 结构 时 , 将 每 个 文件 描述 符 
都 初始 化 为 一 1。 如 果 不 能 打开 两 个 数据 库 文件 中 的 一 个 ， 相 应 文件 描述 符 仍 为 一 1， 
也 就 是 无 需 关闭 它 。) 


200 if (db->idxbuf != NULL) 


201 


free (db->idxbuf) ; 


202 if (db->datbuf != NULL) 


203 


free (db->datbuf) ; 


204 if (db->name != NULL) 


free (db->name) ; 


209 * Fetch a record. Return a pointer to the null-terminated data. 


212 db_fetch(DBHANDLE h, const char *key) 


*db = h; 


205 

206 free (db); 
207 } 

208 /* 

210 */ 

211 char * 

213 { 

214 DB 

215 char 


*ptr; 


216 if ( db find and lock(db, key, 0) < 0) { 


217 ptr - NULL; /* error, record not found */ 
218 db-»cnt fetcherr**; 

219 ) else ( 

220 ptr = db readdat (db); /* return pointer to data */ 
221 db->cnt_fetchok++; 

222 } 

223 £m 

224 * Unlock the hash chain that db find and lock locked. 
225 */ 


226 if (un lock(db-»idxfd, db-»chainoff, SEEK SET, 1) < 0) 


227 err dump("db fetch: un lock error"); 

228 return(ptr); 

229 } 

[200—207] ” 接着， 释放 动 态 分 配 的 缓冲 区 。 可 以 安全 地 将 一 个 空 指针 传递 给 free 函数 ， 这 
样 也 就 无 需 事先 检查 每 个 缓冲 区 指针 的 值 ， 但 是 我 们 认为 只 释放 已 分 配 的 对 象 是 
一 种 较 好 的 编程 风格 。( 并 非 所 有 释放 程序 都 像 free 那样 容忍 差错 。) 最 后 ， 释 
放 DB 结构 占用 的 存储 区 。 

[208—218] ”函数 db fetch 根据 给 定 的 键 来 读 取 一 条 记录 。 它 调用 db find and lock 在 


数据 库 中 查找 记录 。 若 不 能 找到 该 记录 ， 则 将 返回 值 (ptr) 设置 为 NULL， 将 不 
成 功 的 记录 搜索 计数 器 值 加 1。 因 为 从 _db_find and_lock 返回 时 ， 数 据 库 索 
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引文 件 是 加 锁 的 ， 所 以 先 要 解锁 ， 然 后 再 返回 。 
[219 一 229] ”如 果 找 到 了 记录 , 调用 _db_readdat 读 相应 的 数据 记录 ,并 将 成 功 记录 搜索 计数 
器 值 加 1。 在 返回 前 ， 调 用 un lock 对 索引 文件 解锁 。 然 后 ， 返 回 所 找到 记录 的 
指针 【如果 没有 找到 所 需 记 录 ， 则 返回 NULL). 762 


230- /* 

23] * Find the specified record. Called by db delete, db fetch, 
232 * and db store. Returns with the hash chain locked. 

233 */ 

234 static int 

235 db find and lock(DB *db, const char *key, int writelock) 


236 4 

237 off t offset, nextoffset; 

238 (* 

239 * Calculate the hash value for this key, then calculate the 
240 * byte offset of corresponding chain ptr in hash table. 

241 * This is where our search starts. First we calculate the 
242 * offset in the hash table for this key. 

243 ef 

244 db->chainoff = (_db_hash(db, key) * PTR_SZ) + db->hashoff; 
245 db->ptroff = db->chainoff; 

246 [5*5 

247 * We lock the hash chain here. The caller must unlock it 
248 * when done. Note we lock and unlock only the first byte. 
249 *y 

250 if (writelock) { 

251 if (writew lock(db-»idxfd, db-»chainoff, SEEK SET, 1) < 0) 
252 err dump(" db find and lock: writew lock error"); 
253 ) else { 

254 if (readw lock(db-»idxfd, db-»chainoff, SEEK SET, 1) < 0) 
255 err dump(" db find and lock: readw lock error"); 

256 ) 

257 JF 

258 * Get the offset in the index file of first record 

259 * on the hash chain (can be 0). 

260 wp 

261 offset = _db readptr (db, db->ptroff); 


[230—237] | db find and lock 函数 在 函数 库 内 部 用 于 按 给 定 的 键 查找 记录 。 在 搜索 记录 
时 ， 如 果 想 在 索引 文件 上 加 一 把 写 锁 ， 则 将 writelock 参数 设置 为 非 0 值 。 如 
RH writelock 参数 设置 为 0， 则 在 搜索 记录 时 ， 在 索引 文件 上 加 读 锁 。 
[238—256] “在 db find and lock 中 准备 遍历 散 列 链 。 将 键 转换 为 散 列 值 ， 用 其 计算 在 文 
件 中 相应 散 列 链 的 起 始 地 址 (chainoff)。 在 遍历 散 列 链 前 ,等 待 获 得 锁 。 注意， 
只 锁 该 散 列 链 开始 处 的 第 1 个 字 节 。 这 种 方式 允许 多 个 进程 同时 搜索 不 同 的 散 列 
链 ， 因 此 增加 了 并 发 性 。 
[257—261] ”调用 _dqb_readptr 读 散 列 链 中 的 第 一 个 指针 。 如 果 该 函数 返回 0， 则 该 散 列 链 为 空 。 


262 while (offset != 0) { 
263 nextoffset = _db readidx(db, offset); 
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283 
284 
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if (strcmp (db->idxbuf，key) == 0) 
break; /* found a match */ 
db->ptroff = offset; /* offset of this (unequal) record */ 
offset = nextoffset; /* next one to compare */ 
) 
/* 
* offset -- 0 on error (record not found). 
*y 
return (offset == 0 ? -1 : 0); 
} 
/* 
* Calculate the hash value for a key. 
*/ 
static DBHASH 


.db hash(DB *db, const char *key) 
{ 


DBHASH hval = 0; 
char c; 
int i; 
for (i = 1; (c = *key++) != 0; i++) 
hval += c * i; /* ascii char times its 1-based index */ 


return (hval % db->nhash) ; 
} 


[262—268] while 循环 遍历 散 列 链 中 的 每 一 条 索引 记录 ， 并 比较 键 。 调 用 函数 db readidx 


读 取 每 条 索引 记录 。 它 将 当前 记录 的 键 填 入 DB 结构 中 的 idxbuf 字段 。 如 果 
_db_readidx 返回 0， 则 已 到 达 散 列 链 的 最 后 一 记录 项 。 


[269—273] ”如 果 在 循环 后 ，offset 为 0， 说 明 已 达到 散 列 链 未 端 而 且 没 有 找到 匹配 键 ， 于 是 


返回 一 1。 耕 则 ， 找 到 了 匹配 记录 (用 break 语句 退出 了 循环 )， 所 以 返回 0 表示 成 
功 。 此 时 ，ptroff 字段 包含 前 一 索引 记录 的 地 址 ，datoff 包含 数据 记录 的 地 址 ， 
datlen 是 数据 记录 的 长 度 。 当 沿 着 散 列 链 进行 遍历 时 ， 必 须 始 终 保 存 当前 索引 记 
录 的 前 一 条 索引 记录 ， 其 中 有 一 个 指针 指向 当前 索引 记录 。 这 样 做 在 删除 一 条 记录 
时 很 有 用 ， 因 为 必须 修改 当前 索引 记录 的 前 一 条 记录 的 链 指针 以 删除 当前 记录 。 


[274—286] ^ db hash 根据 给 定 的 键 计算 散 列 值 。 它 将 键 中 的 每 一 个 ASCII 字符 乘 以 这 个 字 


287 
288 
289 
290 
291 
292 
293 
294 
295 


296 


符 在 字符 串 中 以 1 开始 的 索引 号 ， 将 这 些 结果 加 起 来 ， 除 以 散 列 表 记 录 项 数 ， 将 
余数 作为 这 个 键 的 散 列 值 。 回 忆 散 列表 记录 项 数 是 137， 它 是 一 个 素数 ， 按 
Knuth[1998]， 素 数 散 列 通常 能 提供 良好 的 分 布 特性 。 


/* 
* Read a chain ptr field from anywhere in the index file: 
* the free list pointer, a hash table chain ptr, or an 
* index record chain ptr. 
*/ 
static off t 
.db readptr(DB *db, off t offset) 
[ 
char asciiptr[PTR SZ + 1]; 


if (lseek(db->idxfd, offset, SEEK SET) == -1) 
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297 err dump(" db readptr: lseek error to ptr field"); 

298 if (read(db->idxfd, asciiptr, PTR SZ) != PTR SZ) 

299 err dump(" db readptr: read error of ptr field"); 

300 asciiptr[PTR SZ] = 0; /* null terminate */ 

301 return(atol(asciiptr)); 

302 } 

303 /* 

304  * Read the next index record. We start at the specified offset 

305 * in the index file. We read the index record into db->idxbuf 

306 * and replace the separators with null bytes. If all is OK we 

307 * set db->datoff and db->datlen to the offset and length of the 

308  * corresponding data record in the data file. 

309  */ 

310 static off t 

311 db readidx(DB *db, off t offset) 

312. { 

313 ssize t i; 

314 char *ptrl, *ptr2; 

315 char asciiptr[PTR SZ + 1], asciilen[IDXLEN SZ + 1]; 

316 struct iovec iov[2]; 

[287—302] ^ db readptr 函数 读 取 以 下 3 种 不 同 链表 指针 中 的 任意 一 种 : (Ca) 索引 文件 最 开 
始 处 指向 空闲 链表 中 第 一 个 索引 记录 的 指针 ，(b) 散 列 表 中 指向 散 列 链 的 第 一 条 
索引 记录 的 指针 ，(c) 存放 在 每 条 索引 记录 开始 处 、 指 向 下 一 条 记录 的 指针 OX 
里 的 索引 记录 既 可 以 处 于 一 条 散 列 链表 中 ， 也 可 以 处 于 空闲 链表 中 )。 返 回 前 ， 将 
指针 从 ASCI 形式 转换 为 长 整 型 。 此 函数 不 进行 任何 加 锁 操 作 ， 所 以 其 调用 者 应 
事先 做 好 必要 的 加 锁 。 

[303—316] ^ db readidx 函数 用 于 从 索引 文件 的 指定 偏 移 量 处 读 取 索引 记录 。 如 果 成 功 ,该 
函数 将 返回 链表 中 下 一 条 记录 的 偏 移 量 。 该 函数 还 填充 DB 结构 的 许多 字段 : 
idxoff 包含 索引 文件 中 当前 记录 的 偏 移 量 , ptrval 包含 在 散 列 链表 中 下 一 个 索 
引 项 的 偏 移 量 ，idxlen 包含 当前 索引 记录 的 长 度 ，idxbuf 包含 实际 索引 记录 ， 
datoff 包含 数据 文件 中 该 记录 的 偏 移 量 ，dat len 包含 该 数据 记录 的 长 度 。 

317 i 

318 * Position index file and record the offset. db_nextrec 

319 * calls us with offset==0, meaning read from current offset. 

320 * We still need to call lseek to record the current offset. 

321 Ey 

322 if ((db->idxoff = lseek(db->idxfd, offset, 

323 offset == 0 ? SEEK CUR : SEEK SET)) == -1) 

324 err dump(" db readidx: lseek error"); 

325 i* 

326 * Read the ascii chain ptr and the ascii length at 

327 * the front of the index record. This tells us the 

328 * remaining size of the index record. 

329 */ 

330 iov[0].iov base - asciiptr; 

331 iov[0].iov len = PTR SZ; 

332 iov[1].iov base = asciilen; 


iov[1].iov len = IDXLEN SZ; 


765 
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334 
335 
336 
337 
338 


339 
340 
341 
342 
343 


344 
345 
346 
347 


if ((i = readv(db->idxfd, &iov[0], 2)) != PTR SZ + IDXLEN SZ) { 
if (i == 0 && offset == 0) 
return(-1); /* EOF for db nextrec */ 


err dump(" db readidx: readv error of index record"); 


/* 
* This is our return value; always »- O0. 
*y 
asciiptr[PTR_SZ] = 0; /* null terminate */ 
db->ptrval = toll(asciiptr); /* offset of next key in chain */ 
asciilen[IDXLEN_SZ] = 0; /* null terminate */ 


if ((db->idxlen = atoi(asciilen)) < IDXLEN_MIN || 
db->idxlen > IDXLEN_MAX) 
err dump(" db readidx: invalid length"); 








[317—324] 。 按 调 用 者 提供 的 参数 查找 索引 文件 偏 移 量 。 在 DB 结构 中 记录 该 偏 移 量 , 为 此 即使 


调用 者 想 要 在 当前 文件 偏 移 量 处 读 记 录 (设置 offset 为 0)， 仍 需要 调用 1seek 
以 确定 当前 偏 移 量 。 因 为 在 索引 文件 中 ， 索 引 记录 决 不 会 存放 在 偏 移 量 为 0 处 ， 
所 以 可 以 放心 地 使 用 0 表示 “从 当前 偏 移 量 处 读 ”。 


[325—338] WH readv 读 在 索引 记录 开始 处 的 两 个 定 长 字段 : 指向 下 一 索引 记录 的 链 指针 和 


该 索引 记录 余下 部 分 的 长 度 〈 余 下 部 分 是 变 长 的 )。 


[339—347] ”将 下 一 记录 的 偏 移 量 转换 为 整 型 ， 并 存放 到 ptrval 字段 中 〈 这 将 被 用 作 此 函数 


348 
349 
350 
351 
352 
353 
354 
355 
356 


357 
358 
359 
360 
361 
362 


363 
364 
365 


366 
367 


368 
369 
370 


的 返回 值 )。 然 后 将 索引 记录 的 长 度 转换 为 整 型 ， 并 存放 到 idxlen 字段 中 。 


/* 

* Now read the actual index record. We read it into the key 

* buffer that we malloced when we opened the database. 

*7 

if ((i = read(db-»idxfd, db->idxbuf, db->idxlen)) != db-»idxlen) 
err dump(" db readidx: read error of index record"); 

if (db-»idxbuf[db-»idxlen-1] != NEWLINE) /* sanity check */ 
err dump(" db readidx: missing newline"); 

db->idxbuf [db->idxlen-1] = 0; /* replace newline with null */ 


/* 
* Find the separators in the index record. 
"y 
if ((ptrl = strchr(db->idxbuf, SEP)) == NULL) 
err dump(" db readidx: missing first separator"); 
*ptrl++ = 0; /* replace SEP with null */ 


if ((ptr2 = strchr(ptrl, SEP)) == NULL) 
err_dump("_db_readidx: missing second separator"); 
*ptr2++ = 0; /* replace SEP with null */ 


if (strchr(ptr2, SEP) != NULL) 
err_dump("_db_readidx: too many separators"); 


/* 
* Get the starting offset and length of the data record. 
x 
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371 if ((db->datoff = atol(ptrl)) < 0) 

372 err_dump("_db_readidx: starting offset < 0"); 

373 if ((db->datlen = atol(ptr2)) <= 0 || db->datlen > DATLEN_MAX) 

374 err dump(" db readidx: invalid length"); 

375 return(db-»ptrval); /* return offset of next key in chain */ 
346.) 


[348—356] ”将 索引 记录 的 变 长 部 分 读 入 DB 结构 中 的 idxbuf 字段 。 该 记录 应 以 换行 符 结尾 。 
用 null 字符 代替 换行 符 。 如 果 索 引文 件 已 遭 破 坏 ， 那 么 调用 err dump 函数 终止 
core 文件 。 
[357 一 367] ”将 索引 记录 划分 成 3 个 字段 : 键 、 对 应 数据 记录 的 偏 移 量 和 数据 记录 的 长 度 。 
strchr 函数 在 给 定 字 符 串 中 找到 第 一 个 指定 字符 。 这 里 ， 我 们 要 寻找 的 是 记录 
中 分 隔 字 段 的 字符 (SsSEP， 此 处 定义 为 冒号 )。 
[368—376] ”将 数据 记录 偏 移 量 和 数据 记录 长 度 转换 为 整 型 ,并 将 它们 存放 在 DB 结构 中 。 然 
后 ， 返 回 在 散 列 链 中 下 一 条 记录 的 偏 移 量 。 注 意 ， 我 们 并 不 读数 据 记 录 ， 这 由 调 
用 者 自己 完成 。 例 如 ， 在 db_fetch 中 ,在 db find and lock 按键 找到 索引 
记录 前 是 不 读 取 数据 记录 的 。 





3771 /* 

378 * Read the current data record into the data buffer. 
379 * Return a pointer to the null-terminated data buffer. 
380  */ 

381 static char * 

382 db readdat(DB *db) 


383 41 

384 if (lseek(db->datfd, db-»datoff, SEEK SET) == -1) 

385 err dump(" db readdat: lseek error"); 

386 if (read(db->datfd, db->datbuf, db-»datlen) != db->datlen) 
387 err dump(" db readdat: read error"); 

388 if (db-»datbuf[db-»datlen-1] != NEWLINE) /* sanity check */ 
389 err dump(" db readdat: missing newline"); 

390 db->datbuf [db->datlen-1] = 0; /* replace newline with null */ 
391 return (db->datbuf) ; /* return pointer to data record */ 
392 } 

apu Jw 

394  * Delete the specified record. 

395 */ 

396 int 

397 db delete(DBHANDLE h, const char *key) 

398 ( 

399 DB *db = h; 

400 int re = 0; /* assume record will be found */ 
401 if ( db find and lock(db, key, 1) == 0) { 

402 .db dodelete (db) ; 

403 db->cnt_delok++; 

404 } else { 

405 re = -1; /* not found */ 

406 db->cnt_delerr++; 

407 } 


408 if (un_lock(db->idxfd, db->chainoff, SEEK SET, 1) < 0) 
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409 
410 
411 


err_dump("db delete: un_lock error"); 
return(rc); 
} 


[377—392] ”在 datoff 和 datlen 已 经 被 正确 初始 化 后 ，_db_readdat 函数 将 数据 记录 的 


ARRA DB 结构 中 的 datbuf 字段 指向 的 缓冲 区 。 


[393—411] | db delete 函数 用 于 删除 与 给 定 键 匹 配 的 一 条 记录 。 fH] db find and lock 


412 
413 
414 
415 
416 
417 
418 
419 
420 
421 
422 


423 
424 
425 
426 
427 
428 
429 
430 
431 


432 
433 
434 
435 
436 


437 
438 
439 
440 


来 判断 在 数据 库 中 该 记录 是 否 存 在 。 如 果 存 在 ， 则 调用 _dpb_dodelete 函数 执行 
删除 该 记录 的 操作 。_db_find_and_lock 的 第 三 个 参数 控制 对 散 列 链 是 加 读 锁 
还 是 写 锁 。 此 处 ， 因 为 可 能 执行 更 改 该 链表 的 操作 ， 所 以 要 加 一 把 写 锁 。 
_db_find_and_lock 返回 时 ， 这 把 锁 仍 旧 存 在 ， 为 此 不 管 是 否 找到 了 所 需 的 记 
录 ， 都 需要 解除 这 把 锁 。 


/* 

* Delete the current record specified by the DB structure. 
* This function is called by db delete and db store, after 
* the record has been located by db find and lock. 

ay! 

static void 


_db_dodelete(DB *db) 


{ 


int d^ 

char *ptr; 

off t freeptr, saveptr; 

/* 

* Set data buffer and key to all blanks. 
ay 


for (ptr = db->datbuf, i = 0; i < db-»datlen - 1; i++) 
*ptr++ = SPACE; 

*ptr = 0; /* null terminate for db writedat */ 

ptr = db->idxbuf; 

while (*ptr) 
*ptr++ = SPACE; 


/* 

* We have to lock the free list. 

y 

if (writew_lock(db->idxfd, FREE_OFF, SEEK_SET, 1) < 0) 
err dump(" db dodelete: writew lock error"); 


/* 

* Write the data record with all blanks. 

s7 

_db_writedat (db, db->datbuf, db->datoff, SEEK_SET); 





[412—431] _db_dodelete 函数 执行 从 数据 库 中 删除 一 条 记录 的 所 有 操作 。( 该 函数 也 可 以 


由 db_store 调用 。) 此 函数 的 大 部 分 工作 仅仅 是 更 新 空闲 链表 以 及 与 键 对 应 的 散 
列 链 。 当 一 条 记录 被 删除 后 ， 将 其 键 和 数据 记录 设 为 空 。 本 章 后 面 将 提 到 的 函数 
db nextrec 要 用 到 这 一 点 。 


[432—440] WHH writew_lock 对 空闲 链表 加 写 锁 ， 这 样 能 防止 两 个 进程 同时 删除 不 同 链表 
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上 的 记录 时 产生 相互 影响 ， 因 为 要 将 被 删除 的 记录 添加 到 空闲 链表 中 ， 这 将 改变 
空闲 链表 指针 ， 而 一 次 只 能 有 一 个 进程 能 这 样 做 。 

调用 函数 db writedat 清空 数据 记录 。 这 时 db writedat 并 不 对 数据 文件 加 
写 锁 ， 这 是 因为 db delete 对 这 条 记录 的 散 列 链 已 经 加 了 写 锁 ， 这 保证 不 会 再 
有 其 他 进程 能 够 读 、 写 这 条 记录 。 





441 
442 
443 
444 
445 
446 


447 
448 
449 
450 
451 


452 
453 
454 
455 
456 
457 


458 
459 
460 
461 


462 
463 
464 
465 
466 
467 
468 
469 
470 
471 


} 





/* 

* Read the free list pointer. Its value becomes the 

* chain ptr field of the deleted index record. This means 
* the deleted record becomes the head of the free list. 

By 

freeptr = _db_readptr(db, FREE_OFF); 


/* 

* Save the contents of index record chain ptr, 
* before it's rewritten by db writeidx. 

X 

saveptr - db-»ptrval; 


/* 

* Rewrite the index record. This also rewrites the length 

* of the index record, the data offset, and the data length, 
* none of which has changed, but that's OK. 

*f 


db writeidx(db, db->idxbuf, db->idxoff, SEEK SET, freeptr); 


/* 
* Write the new free list pointer. 


*/ 


_db writeptr(db, FREE OFF, db-»idxoff); 


/* 

* Rewrite the chain ptr that pointed to this record being 

* deleted. Recall that db find and lock sets db-»ptroff to 
* point to this chain ptr. We set this chain ptr to the 

* contents of the deleted record's chain ptr, saveptr. 


*/ 


.db writeptr(db, db->ptroff, saveptr); 


if (un lock(db-»idxfd, FREE OFF, SEEK SET, 1) < 0) 
err dump(" db dodelete: un lock error"); 


[441—461] ， 读 空闲 链表 指针 ， 接 着 修改 索引 记录 。 让 这 条 记录 的 下 一 条 记录 指针 指向 空闲 链 


表 的 第 一 条 记录 〔 如 果 空 闲 链表 为 空 ， 则 这 个 新 的 链表 指针 置 为 0)。 清 除 键 之 后 
用 正 被 删除 索引 记录 的 偏 移 量 更 新 空闲 链表 指针 ， 也 就 是 使 其 指向 当前 删除 的 这 
条 记录 。 这 意味 着 空闲 链表 的 处 理 基于 后 进 先 出 (虽然 是 以 首次 适应 算法 来 删除 
空闲 链表 项 )， 也 就 是 说 被 删除 的 记录 都 被 添加 到 空闲 链表 头 部 。 

没有 为 每 个 文件 分 别 设置 空闲 链表 。 将 一 个 删除 的 索引 记录 添加 到 空闲 链表 时 ， 该 
索引 记录 仍 指向 已 删除 的 数据 记录 。 当 然 还 有 更 好 的 处 理 方法 ， 但 复杂 性 会 增加 。 


[462 一 471] ”修改 散 列 链 中 前 一 条 记录 的 指针 ， 使 其 指向 正 删除 记录 之 后 的 记录 ， 这 样 就 从 散 


列 链 中 移 除了 要 删除 的 记录 。 最 后 对 空闲 链表 解锁 。 


770 
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473 
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490 
491 


492 
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494 
495 
496 
497 


498 
499 
500 
501 


/* 


* Write a data record. Called by _db dodelete (to write 
* the record with blanks) and db_store. 


ep 


static void 
_db writedat (DB *db, const char *data, off_t offset, int whence) 


{ 


} 


struct iovec iov([2]; 
static char newline - NEWLINE; 
/* 


* If we're appending, we have to lock before doing the lseek 
* and write to make the two an atomic operation. If we're 
* overwriting an existing record, we don't have to lock. 


ay: 
if (whence == SEEK_END) /* we're appending, lock entire file */ 
if (writew_lock(db->datfd, 0, SEEK SET, 0) < 0) 
err dump(" db writedat: writew lock error"); 
if ((db->datoff = lseek(db-»datfd, offset, whence)) == -1) 


err dump(" db writedat: lseek error"); 
db->datlen = strlen(data) + 1; /* datlen includes newline */ 


iov[0].iov base = (char *) data; 

iov[0].iov len = db-»datlen - 1; 

iov[1].iov base = &newline; 

iov[1].iov len = 1; 

if (writev(db->datfd, &iov[0], 2) != db->datlen) 


err dump(" db writedat: writev error of data record"); 


if (whence == SEEK END) 
if (un lock(db-»datfd, 0, SEEK SET, 0) < 0) 
err dump(" db writedat: un lock error"); 


[472—491] “调用 函数 db writedat 写 一 个 数据 记录 。 当 删除 一 记录 时 ， 调 用 函数 _qdb 


_writedat 清空 数据 记录 ; 这 时 _db_writedat 并 不 对 数据 文件 加 写 锁 ， 因 为 
db delete 对 这 条 记录 的 散 列 链 已 经 加 了 写 锁 ， 这 保证 不 会 再 有 其 他 进程 能 够 
读 、 写 这 条 记录 。 在 本 节 稍 后 处 说 明 db store 函数 时 ， 会 遇 到 db writedat 
函数 追加 写 数据 文件 的 情况 ， 此 时 就 必需 对 该 文件 加 锁 。 

定位 到 要 写 数据 记录 的 位 置 。 要 写 的 字 节 数 是 记录 长 度 加 1 个 字 节 ， 这 1 个 字 节 
是 表示 记录 终止 的 换行 符 。 


[492—501] ”设置 iovec 数组 , 调用 writev 写 数据 记录 和 换行 符 。 不 能 想当然 地 认为 调用 者 


/* 


缓冲 区 的 尾 端 有 空间 可 以 追加 换行 符 ， 所 以 应 该 将 换行 符 写 入 另 一 个 缓冲 区 ， 然 
后 再 从 该 缓冲 区 写 至 数据 记录 。 如 果 正 在 对 文件 追加 一 条 记录 ， 那 么 就 释放 早先 
获得 的 锁 。 


* Write an index record. db writedat is called before 
* this function to set the datoff and datlen fields in the 
* DB structure, which we need to write the index record. 
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524 
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526 
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529 
530 
531 


*j 
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static void 


{ 


_db_writeidx(DB *db, const char *key, 


off_t offset, int whence, off_t ptrval) 


struct iovec iov[2]; 
char asciiptrlen[PTR_SZ + IDXLEN_SZ + 1]; 
int len; 


if ((db->ptrval = ptrval) < 0 || ptrval > PTR_MAX) 

err quit(" db writeidx: invalid ptr: %d", ptrval); 
sprintf (db->idxbuf, "%s%c%lld%c%ld\n", key, SEP, 

(long long) db->datoff, SEP, (long) db->datlen) ; 

len = strlen (db->idxbuf) ; 
if (len < IDXLEN_MIN || len > IDXLEN_MAX) 

err dump(" db writeidx: invalid length"); 
sprintf(asciiptrlen, "$*11d$*d", PTR SZ, (long long)ptrval, 
IDXLEN SZ, len); 


/* 
* If we're appending, we have to lock before doing the lseek 
* and write to make the two an atomic operation. If we're 
* overwriting an existing record, we don't have to lock. 
sy 
if (whence == SEEK END) /* we're appending */ 

if (writew lock(db-»idxfd, ((db->nhash+1)*PTR_SZ)+1, 
SEEK SET, 0) < 0) 
err dump(" db writeidx: writew lock error"); 


[502—522] ”调用 db writeidx 函数 写 一 条 索引 记录 。 在 验证 散 列 链 中 下 一 个 指针 有 效 后 ， 


创建 索引 记录 ， 并 将 它 的 后 半 部 分 存放 到 idxbuf 中 。 需 要 索引 记录 这 一 部 分 的 
长 度 以 创建 该 记录 的 前 半 部 分 ， 而 前 半 部 分 被 存放 到 局 部 变量 asciiptrlen 中 。 
注意 ， 使 用 强制 类 型 转换 使 得 sprintf 语句 的 参数 的 长 度 与 格式 说 明 中 相 匹 配 ， 
这 样 做 是 因为 off_t 和 size t 数据 类 型 的 长 度 因 平台 不 同 而 不 同 ,32 位 系统 也 
能 提供 64 位 文件 偏 移 量 ， 所 以 不 能 假定 ott t 数据 类 型 的 长 度 。 


[523~531] 4I db writedat 一 样 ， 只 有 在 追加 新 索引 记录 时 这 一 函数 才 需 要 加 锁 。 


532 
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534 
535 
536 


537 
538 
539 
540 
541 
542 


_db_dodelete 调用 此 函数 是 为 了 重 写 一 条 已 有 的 索引 记录 。 在 这 种 情况 下 ， 调 
用 者 已 经 在 散 列 链 上 加 了 写 锁 ， 所 以 不 再 需要 加 另外 的 锁 。 


/* 

* Position the index file and record the offset. 

xf 

if ((db-»idxoff - lseek(db-»idxfd, offset, whence)) -- -1) 


err dump(" db writeidx: lseek error"); 


iov[0].iov base = asciiptrlen; 

iov[0].iov len = PTR SZ + IDXLEN SZ; 

iov[1].iov base = db->idxbuf; 

iov[1].iov len = len; 

if (writev(db-»idxfd, &iov[0], 2) != PTR SZ + IDXLEN SZ + len) 
err dump(" db writeidx: writev error of index record"); 
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/* 





if (whence == SEEK END) 
if (un lock(db-»idxfd, ((db-»nhash-*1)*PTR SZ)41, 
SEEK SET, 0) « 0) 
err dump(" db writeidx: un lock error"); 


* Write a chain ptr field somewhere in the index file: 
* the free list, the hash table, or in an index record. 


uA 


sta 


tic void 


_db writeptr (DB *db, off t offset, off t ptrval) 


{ 


} 


char asciiptr[PTR_SZ + 1]; 


if (ptrval < 0 || ptrval > PTR_MAX) 
err quit(" db writeptr: invalid ptr: $d", ptrval); 
sprintf(asciiptr, "$*11ld", PTR SZ, (long long)ptrval); 


if (lseek(db->idxfd, offset, SEEK SET) == -1) 
err dump(" db writeptr: lseek error to ptr field"); 
if (write(db->idxfd, asciiptr, PTR SZ) !- PTR SZ) 


err dump(" db writeptr: write error of ptr field"); 


[532—547] ”定位 到 开始 写 索 引 记 录 的 位 置 ， 将 该 偏 移 量 存 入 DB 结构 的 idxoff 字段 。 因 为 


在 两 个 独立 的 缓冲 区 中 构建 索引 记录 , 所 以 调用 writev 将 它 存放 到 索引 文件 中 。 
如 果 是 追加 写 该 文件 ， 则 释放 在 定位 操作 前 获得 的 锁 。 从 并 发 运行 进程 妃 加 新 记 
录 到 数据 库 的 角度 思考 问题 ， 那 么 这 把 锁 使 定位 操作 和 写 操作 成 为 原子 操作 。 


[548—563] ^ db writeptr 被 用 于 将 一 散 列 链 指针 写 至 索引 文件 中 。 验 证 该 指针 在 索引 文件 
的 边界 范围 内 ， 然 后 将 它 转换 成 ASCH 字符 串 。 按 指定 的 偏 移 量 在 索引 文件 中 定 
位 ， 然 后 将 该 指针 ASCII 字符 串 写 入 索引 文件 。 

564 /* 

565 * Store a record in the database. Return 0 if OK, 1 if record 

566 * exists and DB INSERT specified, -1 on error. 

567  */ 

568 int 

569 db store(DBHANDLE h, const char *key, const char *data, int flag) 

570 ( 

571 DB *db - h; 

572 int rc, keylen, datlen; 

573 off t ptrval; 

574 if (flag != DB INSERT && flag !- DB REPLACE && 

575 flag !- DB STORE) { 

576 errno - EINVAL; 

577 return(-1); 

578 ) 

579 keylen = strlen(key); 

580 datlen = strlen(data) + 1; /* *1 for newline at end */ 

581 if (datlen « DATLEN MIN || datlen » DATLEN MAX) 

582 err dump("db store: invalid data length"); 





589 ¥/ 
590 if 


[564—582] 


[583—596] 
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608 


609 
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620 


20.8 源 代 码 629 


_db_find_and_lock calculates which hash table this new record 
goes into (db->chainoff), regardless of whether it already 
exists or not. The following calls to db writeptr change the 
hash table entry for this chain to point to the new record. 
The new record is added to the front of the hash chain. 


(_db_find_and_lock(db, key, 1) < 0) ( /* record not found */ 
if (flag == DB_REPLACE) { 
re = =l? 
db->cnt_storerr++; 
errno = ENOENT; /* error, record does not exist */ 
goto doreturn; 


db_store 函数 的 功能 是 将 一 条 记录 添加 到 数据 库 中 。 首 先 验证 参数 flag 的 值 。 
然后 ， 检 查 数据 记录 长 度 是 否 有 效 。 如 果 无 效 ， 则 删除 core 文件 并 终止 。 作 为 一 
个 例子 这 样 处 理 无 可 厚 非 ， 但 如 果 构 造 正式 应 用 的 函数 库 ， 那 么 最 好 返回 出 错 状 
态 而 非 终 止 ， 这 样 可 以 给 应 用 程序 一 个 恢复 的 机 会 。 

VaFA_db_find_and_lock 以 查看 这 个 记录 是 否 已 经 存在 。 如 果 记 录 并 不 存在 且 指 定 
的 标志 为 DB_INSERT 或 DB_STORE， 或 者 记录 存在 且 指定 的 标志 为 DB REPLACE 
或 DB_STORE， 那 么 这 些 都 是 允许 的 。 替 换 一 条 已 有 的 记录 意味 着 键 不 变 ， 而 数 
据 记 录 很 可 能 不 同 。 注 意 ， 因 为 db store 很 可 能 会 改变 散 列 链 ， 所 以 调用 
_db_find_and_lock 的 最 后 一 个 参数 指明 要 对 散 列 链 加 写 锁 。 


/* 

* db find and lock locked the hash chain for us; read 

* the chain ptr to the first index record on hash chain. 
*/ 
ptrval = db readptr(db, db->chainoff) ; 


if ( db findfree(db, keylen, datlen) < 0) { 
/* 
* Can't find an empty record big enough. Append the 
* new record to the ends of the index and data files. 
*/ 
db writedat(db, data, 0, SEEK END); 
.db writeidx(db, key, 0, SEEK END, ptrval); 


/* 

* db-»idxoff was set by db writeidx. The new 

* record goes to the front of the hash chain. 

Ey 
_db_writeptr (db, db->chainoff, db->idxoff); 
db->cnt_storl++; 

} else { 

/* 

* Reuse an empty record. db findfree removed it from 
* the free list and set both db->datoff and db-»idxoff. 
* Reused record goes to the front of the hash chain. 


$y 


630 第 20 章 数据 库 函 数 库 





621 _db_writedat (db, data, db-»datoff, SEEK SET); 

622 _db_writeidx(db, key, db->idxoff, SEEK_SET, ptrval); 

623 _db writeptr(db, db->chainoff, db-»idxoff); 

624 db->cnt_stor2++; 

625 } 

[597—601] EWH db find and lock 后 ， 代 码 分 成 4 种 情况 。 前 两 种 情况 中 ， 没 有 找到 
足够 大 的 空闲 记录 ， 所 以 添加 一 条 新 纪录 。 读 散 列 链 上 第 一 项 的 偏 移 量 。 

[602—614] ”第 1 种 情况 : 调用 db findfree 在 空闲 链表 中 搜索 一 条 已 删除 的 记录 ， 它 的 键 
长 度 和 数据 长 度 与 参数 keylen 和 datlen 相同 。 如 果 没 有 找到 对 应 大 小 的 空闲 
记录 ， 这 意味 着 要 将 这 条 新 记录 追加 到 索引 文件 和 数据 文件 的 末尾 。 调 用 ab 
_writedat 写 数据 部 分 , 调用 db writeidx 写 索 引 部 分 , 调用 db writeptr 
将 新 记录 添加 到 对 应 的 散 列 链 的 头 部 。 将 执行 此 种 情况 的 计数 器 Cent. stor) 
值 加 1， 以便 观察 数据 库 的 运行 状况 。 

[615—625] ”第 2 种 情况 : db findfree 找到 对 应 大 小 的 空 记录 ， 然 后 将 这 条 空 记录 从 
空闲 链表 中 移 除 ( 稍 后 就 会 看 到 do findfree 的 实现 ), 写 入 新 的 索引 记录 
和 数据 记录 ， 然 后 ， 如 同 第 1 种 情况 一 样 ， 将 新 记录 添加 到 对 应 的 散 列 链 的 
头 部 。 将 执行 此 种 情况 的 计数 器 (cnt_stor2) 值 加 1， 以 便 观察 数据 库 的 

626 } else { /* record found */ 

627 if (flag == DB_INSERT) { 

628 ro = J /* error, record already in db */ 

629 db->cnt_storerr++; 

630 goto doreturn; 

631 ) 

632 fs 

633 * We are replacing an existing record. We know the new 

634 * key equals the existing key, but we need to check if 

635 * the data records are the same size. 

636 ba? A 

637 if (datlen != db->datlen) { 

638 _db_dodelete(db); /* delete the existing record */ 

639 7% 

640 * Reread the chain ptr in the hash table 

641 * (it may change with the deletion). 

642 ty 

643 ptrval = _db_readptr (db, db->chainoff) ; 

644 Ze 

645 * Append new index and data records to end of files. 

646 */ 

647 db writedat(db, data, 0, SEEK END); 

648 _db writeidx(db, key, 0, SEEK END, ptrval); 

649 P 

650 * New record goes to the front of the hash chain. 

651 */ 

652 _db writeptr(db, db->chainoff, db->idxoff); 


653 
654 


[626—631] 


[632—654] 


655 

656 

657 

658 

659 

660 

661 ) 
662 £c 
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db->cnt_stor3++; 
} else { 


另 两 种 情况 是 具有 相同 键 的 记录 在 数据 库 中 已 存在 ， 如 果 不 想 替 换 该 记录 ， 则 设 
置 表示 一 条 记录 已 经 存在 的 返回 码 ， 将 存储 出 错 计数 的 计数 器 cnt storerr fi 
加 1， 然 后 跳 转 至 函数 末尾 ， 在 此 处 理 公共 返回 逻辑 。 

第 3 种 情况 : 要 替换 一 条 已 有 记录 ， 而 新 数据 记录 的 长 度 与 已 有 记录 的 长 度 不 一 
样 。 调用 _db_dodelete 删除 已 有 记录 , 将 该 删除 记录 放 在 空闲 链表 头 部 。 然 后 ， 
调用 db writedat 和 db writeidx 将 新 记录 追加 到 索引 文件 和 数据 文件 的 
末尾 〈 也 可 以 用 其 他 方法 ， 如 可 以 再 找 一 找 是 否 有 数据 大 小 正好 的 已 删除 的 记录 
项 )。 最 后 调用 db writeptr 将 新 记录 添加 到 对 应 的 散 列 链 的 头 部 。DB 结构 中 


的 cnt_stor3 计数 器 记录 发 生 此 种 情况 的 次 数 。 
/* 
* Same size data, just replace data record. 
* 
/ 


db writedat(db, data, db->datoff, SEEK SET); 
db->cnt_stor4++; 


0; /* OK */ 


663 doreturn: /* unlock hash chain locked by db find and lock */ 


664 if (un lock(db-»idxfd, db-»chainoff, SEEK SET, 1) < 0) 
665 err dump("db store: un lock error"); 

666 return (rc); 

667 } 

668 /* 


669 * Try to find a free index record and accompanying data record 
670 * of the correct sizes. We're only called by db store. 


67r Ww 


672 static int 
673 _db findfree(DB *db, int keylen, int datlen) 


674 { 

675 int rc; 

676 off_t offset, nextoffset, saveoffset; 

677 /* 

678 * Lock the free list. 

679 */ 

680 if (writew lock(db-»idxfd, FREE OFF, SEEK SET, 1) < 0) 
681 err dump(" db findfree: writew lock error"); 

682 y+ 

683 * Read the free list pointer. 

684 EA 

685 saveoffset = FREE_OFF; 

686 offset = _db_readptr (db, saveoffset); 

[655—661] ”第 4 种 情况 : 替换 一 条 已 有 记录 ， 而 新 数据 记录 的 长 度 与 已 有 记录 的 长 度 恰好 一 


FF. 这 是 最 容易 的 情况 , 只 需要 重 写 数据 记录 即 可 , 并 将 这 种 情况 的 计数 器 Cont 
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stor4) 值 加 1。 


[662—667] ”在 正常 情况 下 ， 设 置 表示 成 功 的 返回 码 ， 然 后 进入 公共 返回 逻辑 。 对 散 列 链 解锁 


(这 把 锁 是 由 调用 db find and lock 而 加 上 的 )， 然 后 返回 调用 者 。 


[668—686] dbfindfree 函数 试图 找到 一 个 指定 大 小 的 空闲 索引 记录 和 相关 联 的 数据 记录 。 


687 
688 
689 
690 
691 
692 
693 


694 
695 
696 
697 
698 
699 
700 
701 
702 
703 
704 
705 
706 


707 
708 
709 
710 
711 
712 


113 
714 
715 
716 
717 
718 
719 


} 


需要 对 空闲 链表 加 写 锁 以 避免 与 其 他 使 用 空闲 链表 的 进程 互相 影响 。 在 对 空闲 链 
表 加 写 锁 后 ， 得 到 空闲 链表 的 头 指 针 地 址 。 


while (offset != 0) { 
nextoffset = db readidx(db, offset); 
if (strlen(db->idxbuf) == keylen && db->datlen == datlen) 
break; /* found a match */ 


saveoffset - offset; 
offset - nextoffset; 


) 


if (offset == 0) ( 
rc = -1; /* no match found */ 
) else ( 
/* 
* Found a free record with matching sizes. 
* The index record was read in by db readidx above, 
* which sets db->ptrval. Also, saveoffset points to 
* the chain ptr that pointed to this empty record on 
* the free list. We set this chain ptr to db->ptrval, 
* which removes the empty record from the free list. 


id 
db writeptr(db, saveoffset, db->ptrval); 
re = 0; 

/* 


* Notice also that _db readidx set both db->idxoff 
* and db->datoff. This is used by the caller, db_store, 
* to write the new index record and data record. 


*/ 
} 
{* 
* Unlock the free list. 
*j 


if (un lock(db-»idxfd, FREE OFF, SEEK SET, 1) < 0) 
err dump(" db findfree: un lock error"); 
return (rc); 


[687—693] ^ db findfree 中 的 while 循环 遍历 空闲 链表 以 搜寻 一 个 能 够 匹配 键 长 度 和 数 


据 长 度 的 索引 记录 项 。 在 这 个 简单 的 实现 中 ， 只 有 当 一 个 已 删除 记录 的 键 长 度 及 
数据 长 度 与 要 插入 的 新 记录 的 键 长 度 及 数据 长 度 一 样 时 才 重 用 已 删除 记录 的 空 
间 。 还 有 其 他 更 好 的 算法 ， 但 复杂 度 会 增加 。 


[694—712] ”如 果 找 不 到 所 要 求 键 长 度 和 数据 长 度 的 可 用 记录 ， 则 设置 表示 失败 的 返回 码 。 否 


则 ， 将 已 找到 记录 的 下 一 个 链 指针 写 至 前 一 记录 的 链表 指针 。 这 样 就 从 空闲 链表 
中 移 除 了 该 记录 。 
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[713 一 719] ”一 旦 结束 对 空 闪 链表 的 操作 ， 立 即 释放 写 锁 。 然 后 对 调用 者 返回 状态 码 。 





720 
721 
722 
723 
724 
725 
726 
727 
728 
729 


/ * 
* Rewind the index file for db nextrec. 
* Automatically called by db open. 
* Must be called before first db nextrec. 
kV 
void 
db rewind(DBHANDLE h) 
{ 
DB *db = h; 
off t offset; 


offset = (db->nhash + 1) * PTR S2; /* +1 for free list ptr */ 


/* 

* We're just setting the file offset for this process 

* to the start of the index records; no need to lock. 

* +1 below for newline at end of hash table. 

f 

if ((db->idxoff = lseek(db->idxfd, offset41, SEEK SET)) == -1) 
err dump("db rewind: lseek error"); 


* Return the next sequential record. 
* We just step our way through the index file, ignoring deleted 
* records. db rewind must be called before this function is 
* called the first time. 
*/ 
char * 
db nextrec(DBHANDLE h, char *key) 
{ 


DB *db = h; 
char C; 
char *ptr; 


[720—738] | db rewind 函数 用 于 把 数据 库 重 置 到 “起 始 状 态 ”， 将 索引 文件 的 文件 偏 移 量 设置 


为 指向 第 一 条 索引 记录 〈 紧 跟 在 散 列 表 之 后 )。( 回 忆 图 20-2 中 索引 文件 的 结构 。) 


[739—750] ”db_nextrec 函数 返回 数据 库 的 下 一 条 记录 。 返 回 值 是 指向 数据 缓冲 区 的 指针 。 如 


751 
752 
753 
754 
255 
756 


果 调 用 者 提供 的 key 参数 非 空 ， 将 相应 的 键 复制 到 该 缓冲 区 中 。 调 用 者 负责 分 配 可 
以 存放 键 的 足够 大 的 缓冲 区 。 大 小 为 IDXLEN_MAX 字 节 的 缓冲 区 足够 存放 任意 键 。 
记录 按 数据 库 文 件 中 存放 的 顺序 逐一 返回 。 也 就 是 说 ， 记 录 并 不 按键 值 大 小 排序 。 
37h, db nextrec 并 不 跟随 散 列 链表 ， 所 以 已 删除 的 记录 也 会 被 读 取 ， 但 是 不 
向 调用 者 返回 这 种 已 删除 记录 。 

/* $ 

* We read lock the free list so that we don't read 

* a record in the middle of its being deleted. 

*/ 

if (readw_lock (db->idxfd, FREE OFF, SEEK SET, 1) < 0) 
err dump("db nextrec: readw lock error"); 


7719 
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TST do { 

758 fF 

759 * Read next sequential index record. 

760 RJ 

761 if ( db readidx(db, 0) < 0) { 

762 ptr - NULL; /* end of index file, EOF */ 
763 goto doreturn; 

764 } 

765 gs 

766 * Check if key is all blank (empty record). 

767 ey 

768 ptr = db->idxbuf; 

769 while ((c = *ptr++) != 0 && c == SPACE) 

770 ; /* skip until null byte or nonblank */ 

TTA } while (c == 0); /* loop until a nonblank key is found */ 
772 if (key != NULL) 

713 strcpy (key, db-»idxbuf);  /* return key */ 

774 ptr = db readdat (db); /* return pointer to data buffer */ 
775 db->cnt_nextrec++; 


776 doreturn: 


711 if (un lock(db-»idxfd, FREE OFF, SEEK SET, 1) < 0) 
778 err dump("db nextrec: un lock error"); 

779 return (ptr); 

780 } 





[751~756] ”对 空闲 链表 加 读 锁 ， 使 得 正在 读 该 链表 时 ， 其 他 进程 不 能 从 中 移 除 记 录 。 
[557—771] “调用 db readidx 读 下 一 个 记录 。 传 送 给 该 函数 的 偏 移 量 参数 值 为 0， 以 此 通知 
该 函数 从 当前 偏 移 量 继续 读 索 引 记 录 。 因 为 正在 逐条 顺序 读 索 引文 件 ， 所 以 会 读 
到 已 删除 的 记录 。 仅 需 返 回 有 效 记 录 ， 所 以 跳 过 键 是 全 空格 的 记录 CZ 
_db_dodelete 函数 以 设置 全 空格 方式 清除 键 )。 
[772 一 780] ” 当 找 到 一 有 效 键 时 ， 如 果 调 用 者 已 提供 缓冲 区 ， 则 将 该 键 复制 到 该 缓冲 区 。 然 后 
读数 据 记 录 ， 并 将 返回 值 设置 为 指向 包含 数据 记录 的 内 部 缓冲 区 的 指针 值 。 将 统 
计 计 数 器 值 加 1， 对 空闲 链表 解锁 ， 最 后 返回 指向 数据 记录 的 指针 。 
通常 在 下 列 形式 的 循环 中 使 用 db_rewind 和 db_nextrec 这 两 个 函数 : 
db_rewind (db) ; 
while ((ptr = db_nextrec(db, key)) != NULL) { 


/* process record */ 


} 
前 面 曾 警告 过 ， 记 录 的 返回 没有 一 定 的 顺序 ， 它 们 并 不 按键 的 顺序 返回 。 

如 果 db_nextrec 函数 在 循环 中 被 调用 时 数据 库 正 在 被 修改 ， 则 db_nextrec 返回 的 记录 只 
是 变化 中 的 数据 库 在 某 一 时 间 点 的 快照 (snapshot). db_nextrec 被 调用 时 总 是 返回 一 条 “正确 ” 
的 记录 ， 也 就 是 说 它 不 会 返回 一 条 已 删除 的 记录 。 但 有 可 能 一 条 记录 刚 被 db_nextrec 返回 后 就 被 
删除 。 类似 地 ， 如果 db nextrec 刚 跳 过 一 条 已 删除 的 记录 , 这 条 记录 的 空间 就 被 一 条 新 记录 重用 ， 
除非 用 db rewind 重新 遍历 一 遍 ， 否 则 在 结果 中 看 不 到 这 条 新 的 记录 。 如 果 通 过 db nextrec 获 
得 一 份 数据 库 的 准确 的 “冻结 ”的 快照 很 重要 ， 则 在 这 段 时 间 内 应 该 不 做 插入 和 删除 操作 。 
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下 面 来 看 db_nextrec 使 用 的 加 锁 。 因 为 并 不 使 用 任何 散 列 链表 ,也 不 能 判断 每 条 记录 属于 
哪 条 散 列 链 。 所 以 有 可 能 当 db nextrec 读 取 一 条 记录 时 ， 其 索引 记录 正在 被 删除 。 为 了 防止 这 
种 情况 ，db_nextrec 对 空闲 链表 加 读 锁 ， 这 样 就 可 避免 与 db_ dodelete fil db findfree 
相互 影响 。 

在 结束 对 db . c 源 文件 的 说 明之 前 ， 对 向 文件 末尾 追 加 索引 记录 或 数据 记录 时 的 加 锁 再 做 
一 些 说 明 。 在 第 1 种 和 第 3 种 情况 中 ，db_store 调用 db writeidx 和 db writedat 时 ， 
第 3 个 参数 为 0， 第 4 个 参数 为 SEEK_END。 这 里 ， 第 4 个 参数 作为 一 个 标志 用 来 告诉 这 两 个 
函数 ， 新 的 记录 将 被 追加 到 文件 的 末尾 。_db_writeidx 用 到 的 技术 是 对 索引 文件 加 写 锁 ， 加 
锁 的 范围 从 散 列 链 的 末尾 到 文件 的 末尾 。 这 不 会 影响 其 他 数据 库 的 读 进程 和 写 进程 (这 些 进程 
将 对 散 列 链 加 锁 )， 但 如 果 其 他 进程 此 时 调用 db store 来 追加 数据 则 会 被 锁 住 。 
_db_writedat 使 用 的 方法 是 对 整个 数据 文件 加 写 锁 。 同 样 这 也 不 会 影响 其 他 数据 库 的 读 进 程 
和 写 进程 (它们 甚至 不 对 数据 文件 加 锁 )， 但 如 果 其 他 用 户 此 时 调用 db store 来 向 数据 文件 
追加 数据 则 会 被 锁 住 〈 见 习题 20.3)。 
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为 了 测试 这 一 数据 库 函 数 库 ， 也 为 了 获得 一 些 与 典型 应 用 的 数据 访问 模式 有 关 的 时 间 测 量 数 
据 ， 编 写 了 一 个 测试 程序 。 该 程序 接受 两 个 命令 行 参数 : 要 创建 的 子 进 程 的 个 数 和 每 个 子 进程 向 
数据 库 写 的 数据 记录 的 条 数 (nrec)。 然后 (通过 调用 do. open) 创建 一 个 空 的 数据 库 , 通过 fork 
创建 指定 数目 的 子 进程 ， 等 待 所 有 子 进程 结束 。 每 个 子 进程 执行 以 下 步骤 。 781 

(1) 向 数据 库 写 nrec 条 记录 。 

(2) 通过 键 值 读 回 nrec 条 记录 。 

(3) 执行 下 面 的 循环 nrecX5 次 。 

(a) 随机 读 一 条 记录 。 

(b) 每 循环 37 次 ， 随 机 删除 一 条 记录 。 

Cc) 每 循环 11 次 ， 随 机 插入 一 条 记录 并 读 取 这 条 记录 。 

Cd) 每 循环 17 次 ， 随 机 替换 一 条 记录 为 新 记录 。 在 连续 两 次 替换 中 ， 一 次 用 同样 大 小 的 记 
录 替 换 ， 一 次 用 比 以 前 更 长 的 记录 替换 。 

(4) 将 此 子 进 程 写 的 所 有 记录 删除 。 每 删除 一 条 记录 ， 随 机 地 查找 10 条 记录 。 

DB 结构 的 cnt_xxx 变量 记录 对 数据 库 进行 的 操作 数 ， 这 些 变量 的 值 在 函数 中 增加 。 每 个 子 
进程 的 操作 数 一 般 都 会 与 其 他 子 进程 不 一 样 ， 因 为 每 个 子 进程 用 来 选择 记录 的 随机 数 生成 器 是 根 
据 其 进程 ID 来 初始 化 的 。 每 个 子 进程 操作 的 典型 计数 值 见 图 20-6。 

读 取 的 次 数 大 约 是 存储 和 删除 的 10 倍 ， 这 可 能 是 许多 数据 库 应 用 程序 的 典型 情况 。 

每 一 个 子 进程 只 对 该 子 进程 所 写 的 记录 执行 这 些 操作 〈 读 取 、 存 储 和 删除 )。 由 于 所 有 的 子 
进程 对 同一 个 数据 库 进 行 操作 (虽然 对 不 同 的 记录 )， 所 以 会 使 用 并 发 控制 。 数 据 库 中 的 记录 总 
数 与 子 进程 数 成 比例 。( 当 只 有 一 个 子 进程 时 ， 一 开始 有 nrec 条 记录 写 入 数据 库 ; 当 有 两 个 子 进 
程 时 ， 一 开始 有 nrecX2 条 记录 写 入 数据 库 ， 依 此 类 推 。) 

通过 运行 测试 程序 的 3 个 不 同 版 本 来 比较 加 粗 粒度 锁 和 加 细 粒 度 锁 提 供 的 并 发 ， 并 且 比 较 3 
种 不 同 的 加 锁 方式 (不 加 锁 、 建 议 性 锁 和 强制 性 锁 )。 第 一 个 版 本 使 用 20.8 节 中 的 源 代码 ， 称 为 
细 粒 度 锁 版 本 。 第 二 个 版 本 通过 改变 加 锁 调 用 而 使 用 粗 粒 度 锁 ，20.6 节 对 此 已 介绍 过 。 第 三 个 版 
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本 将 所 有 加 锁 例 程 均 去 掉 ， 这 样 可 以 计算 出 加 锁 的 开销 。 通 过 改变 数据 库 文件 的 权限 标志 位 ， 还 
可 以 使 第 一 个 版 本 和 第 二 个 版 本 《加 细 粒 度 锁 和 加 粗 粒 度 锁 ) 使 用 建议 性 锁 或 强制 性 锁 〈 本 节 所 
有 的 测试 中 ， 仅 对 加 细 粒 度 锁 的 实现 测量 了 采用 强制 性 锁 的 时 间 )。 


m 调用 fcnt1 〈 每 个 操作 ) 操作 计数 
粗 粒 度 锁 细 粒 度 锁 (nrec=2 000) 


db_store、DB_INSERT， 无 空白 记录 ， 追 加 
db_store、DB_INSERT， 重 用 空白 记录 
db_store、DB_REPLACE， 数 据 长 度 不 同 ， 追 加 
db_store、DB_REPLACE， 数 据 长 度 相同 
db_store， 没 有 找到 记录 
db_fetch， 找 到 记录 
db_fetch， 没 有 找到 记录 
db_delete， 找 到 记录 
db_delete， 没 有 找到 记录 
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图 20-6 ”每 个 子 进程 操作 的 典型 计数 值 
本 节 所 有 的 测试 都 是 在 一 台 运行 Linux 3.2.0 的 Intel Core-i5 系统 上 运行 的 。 这 个 系统 拥有 4 
个 内 核 ， 因 此 可 以 允许 至 多 4 个 进程 并 发 运行 。 
1. 单 进程 的 结果 
图 20-7 显示 了 只 有 一 个 子 进程 运行 的 结果 ，nrec 分 别 为 2000、6000 和 12000. 


| 


[ amm | mum | mem | 
mm e nn D 


2000 0.10 | 0.22 | 0.33 0.17 | 0.33 | 0.51 0.13 0.38 0.51 0.14 | 0.43 0.58 
6000 0.59 | 1.32 1.91 0.88 | 2.13 | 3.03 0.90 2.14 3.05 0.99 | 2.52 3.53 
12000 || 4.37 | 9.58 | 13.97 || 5.38 | 12.60 | 18.01 5.34 | 12.68 | 18.01 5.53 | 15.03 | 20.60 


图 20-7 单子 进程 、 不 同 的 nrec 和 不 同 的 加 锁 方法 

最 后 12 列 显示 的 是 以 秒 为 单位 的 时 间 。 在 所 有 的 情况 下 , 用 户 CPU 时 间 加 上 系统 CPU 时 间 
都 基本 上 等 于 时 钟 时 间 。 这 一 组 测试 受 CPU 限制 而 不 是 受 磁盘 操作 限制 。 

中 间 6 列 〈 建 议 性 锁 ) 对 加 粗 粒 度 锁 和 加 细 粒 度 锁 的 结果 基本 一 样 。 这 是 可 以 理解 的 ， 因 为 
对 于 单个 进程 来 说 加 粗 粒度 锁 和 加 细 粒 度 锁 并 没有 区 别 ， 除 了 额外 的 £cnci 调用 。 

比较 不 加 锁 和 加 建议 性 锁 , 可 以 看 到 加 锁 调用 在 系统 CPU 时 间 上 增加 了 32% 一 73%。 即 使 这 
些 锁 实际 上 并 没有 使 用 过 (因为 只 有 一 个 进程 运行 )，fcnt1 系统 调用 仍 会 有 一 些 时 间 的 开销 。 
FA? CPU 时 间 对 4 种 不 同 的 加 锁 方法 基本 上 一 样 , 这 是 因为 用 户 代 码 基本 上 是 一 样 的 (除了 调用 
fcntl 的 次 数 有 些 不 同 )。 

关于 图 20-7 要 注意 的 最 后 一 点 是 强制 性 锁 比 建议 性 锁 增 加 了 13% 一 19% 的 系统 CPU 时 间 。 由 于 对 

加 强制 性 细 粒 度 锁 和 加 建议 性 细 粒 度 锁 的 调用 次 数 是 一 样 的 ， 所 以 增加 的 系统 开销 来 自 读 和 写 。 

最 后 的 测试 是 有 多 个 子 进程 的 不 加 锁 的 程序 。 与 预期 的 一 样 ， 结 果 是 随机 的 错误 。 一 般 错误 
情况 包括 : 添加 到 数据 库 中 的 记录 找 不 到 、 测 试 程序 异常 退出 等 。 几 乎 每 次 运行 测试 程序 ， 都 有 
不 同 的 错误 发 生 。 这 是 典型 的 竞争 条 件 一 一 多 个 进程 在 没有 任何 加 锁 的 情况 下 修改 同一 个 文件 ， 
错误 情况 不 可 预测 。 
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2. 多 进程 的 结果 

下 一 组 测试 主要 目的 是 比较 粗 粒 度 锁 和 细 粒 度 锁 的 不 同 。 前 面 说 过 ， 由 于 加 细 粒 度 锁 时 数据 
库 的 各 个 部 分 被 锁 住 的 时 间 比 加 粗 粒 度 锁 少 ， 所 以 从 直觉 上 说 ， 加 细 粒 度 锁 应 该 能 提供 更 好 的 并 
发 性 。 图 20-8 显示 了 nrec 取 2000， 子 进程 数 从 1 一 16 的 测试 结果 。 


建议 性 锁 强制 性 锁 


进程 数 细 粒 度 锁 A 系统 





1 
2 
3 
4 
5 
6 
7 
8 





图 20-8  nrec-2000 时 不 同 加 锁 方 法 的 比较 

所 有 的 用 户 时 间 、 系 统 时 间 和 时 钟 时 间 的 单位 均 为 秒 。 所 有 这 些 时 间 均 是 父 进程 与 所 有 子 进 
程 的 总 和 。 关 于 这 些 数 据 有 许多 需要 考虑 。 

首先 要 注意 的 是 ， 当 使 用 多 进程 时 ， 用 户 时 间 和 系统 时 间 之 和 超过 了 时 钟 时 间 。 乍 看 起 来 这 
有 点 奇怪 ， 不 过 当 采 用 多 核 时 是 正常 的 。 此 时 ， 所 有 并 发 的 进程 在 运行 时 其 时 间 会 累积 起 来 所 
显示 的 CPU 处 理 时 间 是 程序 运行 的 所 有 核 运转 的 时 间 之 和 。 因 为 可 以 并 发 多 个 进程 (每 个 核 运行 
-个 进程 )， 所 以 CPU 处 理 时 间 会 超过 时 钟 时 间 。 

第 8 列 (标记 为 “A 时 钟 ”), 是 加 建议 性 粗 粒度 锁 与 加 建议 性 细 粒 度 锁 的 运行 时 钟 时 间 的 百分比 
差 。 从 中 可 以 看 到 使 用 细 粒 度 锁 得 到 了 多 大 的 并 发 性 。 在 运行 测试 的 系统 上 ， 对 于 单一 进程 加 粗 粒度 [784] 
锁 与 加 细 粒 度 锁 相 比 效果 几乎 相同 。 而 对 于 多 进程 ， 使 用 粗 粒 度 锁 的 时 间 消 耗 会 增 大 〈 约 30% )。 

我 们 希望 从 粗 粒度 锁 到 细 粒 度 锁 时 钟 时 间 会 减少 ， 当 启用 多 进程 后 结果 也 确实 如 此 。 然 而 ， 
我 们 预期 当 对 任意 数量 的 进程 使 用 细 粒 度 锁 时 系统 时 间 仍 然 会 保持 较 高 值 ， 因 为 使 用 细 粒 度 锁 会 
发 出 更 多 的 fcnt1 调用 。 如 果 将 图 20-6 中 的 fenti 调用 次 数 加 在 一 起 , 会 发 现 对 于 粗 粒 度 锁 其 
平均 值 为 87858， 对 于 细 粒 度 锁 其 平均 值 为 115520。 基 于 此 , 我 们 认为 由 于 增加 了 31% 的 fentl 
调用 ， 所 以 会 增加 细 粒 度 锁 的 系统 时 间 。 然 而 ， 在 测试 中 加 细 粒 度 锁 的 两 个 进程 其 系统 时 间 减 少 
了 ， 超 过 两 个 进程 的 系统 时 间 只 有 小 幅 增 加 ， 这 让 人 困惑 。 

出 现 这 种 情况 有 两 个 原因 。 首 先 ， 图 20-7 显示 ， 当 没有 对 锁 进 行 竞争 时 ， 粗 粒度 锁 和 细 粒 度 
锁 的 时 间 之 间 没 有 显著 的 差别 。 这 说 明 对 于 额外 的 fcnt1 调用 所 引起 的 CPU 负载 并 没有 影响 测 
试 程序 的 性 能 。 其 次 ， 使 用 粗 粒度 锁 时 ， 持 有 锁 的 时 间 较 长 ， 这 也 就 增加 了 其 他 进程 因 等 待 该 锁 
而 陷入 阻塞 的 可 能 性 ， 而 使 用 细 粒 度 锁 时 ， 加 锁 的 时 间 较 短 ， 进 程 被 阻塞 的 可 能 性 就 降低 了 。 如 
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果 计 算 font 的 阻塞 次 数 ， 会 发 现在 使 用 粗 粒度 锁 时 ， 进 程 阻塞 频率 更 高 。 例 如 ， 当 有 4 个 进 
程 时 ， 使 用 粗 粒度 锁 的 阻塞 次 数 几乎 是 使 用 细 粒 度 锁 的 阻塞 次 数 的 5 倍 。 正 是 这 些 粗 粒度 锁 需 要 
休眠 和 唤醒 进程 的 额外 时 间 增 加 了 系统 时 间 ， 最 终 降 低 了 两 种 锁 的 系统 时 间 差 异 。 
最 后 一 列 〈 标 记 为 “人 系统 ”)， 是 从 加 建议 性 细 粒 度 锁 到 加 强制 性 细 粒 度 锁 的 系统 CPU 
时 间 百 分 比 的 增 量 。 从 这 些 值 可 以 看 到 ， 随 着 并 发 数 的 增加 ， 强 制 性 锁 显 著 增 加 了 系统 时 间 
(20% 一 76% )。 
由 于 所 有 这 些 测试 的 用 户 代 码 几 乎 一 样 〈《 对 加 建议 性 细 粒 度 锁 和 强制 性 细 粒 度 锁 增加 了 一 些 
font] 调用 2， 因此 预期 对 每 一 行 的 用 户 CPU 时 间 应 基本 一 样 。 
当 我 们 第 一 次 运行 这 些 测试 时 ， 测 试 显 示 对 于 多 进程 完成 锁 的 使 用 ， 其 粗 粒度 锁 的 用 户 时 间 
几乎 是 细 粒 度 锁 的 两 倍 。 因 为 两 个 数据 库 版 本 是 相同 的 ,除了 调用 fcnt1l 的 次 数 不 同 ， 因 此 这 说 
不 通 。 在 调查 研究 之 后 ， 我 们 发 现 使 用 粗 粒度 锁 时 会 有 更 多 的 竞争 ， 进 程 也 就 会 等 待 更 久 ， 操作 
系统 于 是 就 决定 降低 CPU 时 钟 频率 来 节约 电量 。 在 使 用 细 粒 度 锁 时 ， 会 有 更 多 的 活动 ， 于 是 系统 
提高 了 CPU 时 钟 频率 。 这 使 得 使 用 粗 粒 度 锁 比 使 用 细 粒 度 锁 运行 得 慢 。 在 禁用 系统 频率 调整 特性 
后 ， 我 们 的 测试 结果 就 没有 这 些 偏差 了 ， 用 户 时 间 的 差别 也 就 小 多 了 。 


785 图 20-8 的 第 一 行 与 图 20-7 中 的 nrec HX 2000 的 那 一 行 很 相似 。 这 与 预期 一 致 。 

图 20-9 是 图 20-8 中 加 建议 性 细 粒 度 锁 的 数据 图 .我们 绘制 了 进程 数 从 1 一 16 的 时 钟 时 间 ， 
也 绘制 了 用 户 CPU 时 间 除 以 进程 数 后 的 每 进程 用 户 CPU 时 间 , 另外 还 绘制 了 每 进程 系统 CPU 
时 间 。 

注意 ， 这 两 个 每 进程 CPU 时 间 都 是 线性 的 ， 但 时 钟 时 间 是 非 线性 的 。 可 能 的 原因 是 : 当 进 程 
数 增 大 时 ， 操 作 系 统 用 于 进程 切换 的 CPU 时 间 增 多 。 操作 系统 的 开销 会 增加 时 钟 时 间 ， 但 不 会 影 
响 单 个 进程 的 CPU 时 间 。 

用 户 CPU 时 间 随 进程 数 增加 的 原因 可 能 是 因为 数据 库 中 有 了 更 多 的 记录 。 每 一 条 散 列 链 更 
长 ， 所 以 _db_finqd and_lock 函数 平均 要 运行 更 长 时 间 来 找到 一 条 记录 。 
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每 进程 系统 CPU 时 间 ， 
每 进程 用 户 CPU 时 间 
(s) 


每 进程 系统 CPU 时 间 


时 钟 时 间 i-i 
(s) 


时 钟 时 间 1 


每 进程 用 户 CPU 时 间 
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图 20-9 图 20-8 中 使 用 建议 性 细 粒 度 锁 的 数据 


习题 639 


20.10 ”小结 


本 章 详细 介绍 了 一 个 数据 库 函 数 库 的 设计 与 实现 。 考虑 到 篇 幅 , 这 个 函数 库 尽 可 能 小 和 简单 ， 
但 也 包括 了 多 进程 并 发 访问 需要 的 对 记录 加 锁 的 功能 。 

此 外 ， 还 使 用 不 同 数量 的 进程 以 及 不 同 的 加 锁 方法 : 不 加 锁 、 建 议 性 锁 〈 细 粒度 锁 和 粗 粒 度 
锁 ) 和 强制 性 锁 ， 研 究 了 这 个 函数 库 的 性 能 。 可 以 看 到 加 建议 性 锁 比 不 加 锁 在 时 钟 时 间 上 增加 了 
29% 一 59%， 加 强制 性 锁 比 加 建议 性 锁 耗 时 再 增加 约 1596. 


习题 


20.1 YE db dodelete 中 使 用 的 加 锁 是 比较 保守 的 。 例 如 ， 如 果 等 到 真正 要 用 空闲 链表 时 再 加 
锁 ， 则 可 获得 更 大 的 并 发 性 。 如 果 将 调用 writew lock 移 到 调用 db writedat 4 db 
_readptr 之 间 会 发 生 什 么 呢 ? 

20.2 如 果 db nextrec 不 对 空闲 链表 加 读 锁 而 被 读 的 记录 正在 被 删除 ， 描 述 在 怎样 的 情况 下 ， 
db nextrec 会 返回 正确 的 键 但 是 空 的 (不 正确 的 ) 数据 记录 。( 提 示 : 查看 db 
 dodelete.) 

20.3 20.8 节 的 结尾 部 分 描述 了 _qdb_writeidx Wl db writedat 的 加 锁 。 我 们 说 过 这 种 加 锁 
不 会 干涉 除了 调用 do store 之 外 的 其 他 的 读 进 程 和 写 进程 。 如 果 改 为 强制 性 锁 ， 这 还 
成 立 吗 ? 

20.4 怎样 把 fsync 集成 到 这 个 数据 库 函 数 库 中 ? 

20.5 fEdb store 中 ， 先 写 数据 记录 ， 然 后 再 写 索 引 记录 。 如 果 将 顺序 颠倒 ， 会 发 生 什么 ? 

20.6 建立 一 个 新 的 数据 库 并 写 入 一 些 记录 。 写 一 个 程序 调用 db_nextrec 来 读数 据 库 中 的 每 条 
记录 ， 并 调用 _qb_hash 来 计算 每 条 记录 的 散 列 值 。 根 据 每 条 散 列 链 上 的 记录 数 画 出 直方 
Kl]. db hash 中 的 散 列 函数 是 否 能 满足 需求 ? 

20.7 修改 数据 库 函 数 ， 使 得 索引 文件 中 散 列 链 的 数目 可 以 在 数据 库 建立 时 指定 。 

20.8 比较 两 种 情况 下 数据 库 函 数 的 性 能 : (a) 数据 库 与 测试 程序 在 同一 台 机 器 上 ; CO 数据 库 与 
测试 程序 在 不 同 的 机 器 上 ， 经 由 NFS 进行 访问 。 这 个 数据 库 函 数 库 提供 的 记录 锁 机 制 还 能 
工作 吗 ? 

20.9 只 有 当 键 缓冲 区 和 数据 缓冲 区 与 其 所 需 的 大 小 精确 匹配 时 ， 数 据 库 才 会 返回 空闲 链表 记录 。 
请 修改 数据 库 以 使 空闲 链表 可 以 使 用 于 较 大 的 缓冲 区 来 满足 需求 。 应 该 如 何 更 改 数据 库 的 
永久 格式 来 支持 这 种 特性 呢 ? 

20.10 在 实现 了 习题 20.9 的 方案 后 ， 编 写 一 个 工具 以 使 数据 库 格 式 可 以 从 一 种 转换 为 男 一 种 。 
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21.1 引言 


现在 我 们 开发 一 个 能 够 与 网 络 打 印 机 通信 的 程序 。 这 些 打印 机 通过 以 太 网 与 多 个 计算 机 互 
联 ， 并 是 通常 既 支 持 纯 文本 文件 也 支持 PostScript 文件 。 尽 管 一 些 应 用 程序 也 支持 其 他 通信 协议 ， 
但 一 般 使 用 网 络 打 印 协议 CInternet Printing Protocol, IPP) 与 打印 机 通信 。 

我 们 将 描述 两 个 程序 : 打印 假 脱 机 守护 进程 (print spooler daemon) 将 作业 发 送 到 打印 机 ， 命 令 行 
程序 将 打印 作业 提交 到 假 脱 机 守护 进程 。 因 为 假 脱 机 守护 进程 必须 处 理 很 多 操作 〈 与 客户 端 通信 来 提交 
作业 、 与 打印 机 通信 、 读 文件 、 扫 描 目 录 等 )， 这 就 提供 了 一 个 机 会 来 使 用 前 面 章 节 所 提 到 的 函数 。 例 
如 ， 使 用 线程 (第 11 章 和 第 12 章 ) 来 简化 假 脱 机 守护 进程 的 设计 ， 使 用 套 接 字 (第 16 章 ) 在 调度 文 
件 打 印 的 程序 和 打印 假 脱 机 守护 进程 之 间 通 信 ， 也 可 以 在 打印 假 脱 机 守护 进程 与 网 络 打印 机 之 间 通 信 。 


21.2 网络 打印 协议 


网 络 打 印 协议 GPP) 为 建立 基于 网 络 的 打印 系统 指定 了 通信 规则 。 通 过 将 一 个 IPP ARS ai tik 
入 到 带 网 卡 的 打印 机 中 ， 打 印 机 就 能 够 对 许多 计算 机 系统 的 请 求 加 以 服务 。 这 些 计算 机 系统 实际 
上 并 不 需要 在 同一 个 物理 网 络 中 。 因 为 IPP 是 建立 在 标准 的 因特网 协议 上 的 ， 所 以 任何 一 台 能 够 

与 打印 机 建立 TCP/IP 连接 的 计算 机 都 能 向 打印 机 提交 打印 作业 。 

IPP 由 一 系列 IETF 标准 文档 (Requests For Comment，RFC) 说 明 ， 这 些 文档 可 以 在 
http://www.ietf. org/rfc.html 上 获得 。IEEE 相关 的 打印 机 工作 组 (Printer Working 
Group) 制定 的 标准 草案 也 可 以 在 http://www.pwg.org/ipp 上 获得 。 图 21-1 列 出 了 IPP 的 
主要 文档 ， 还 有 许多 其 他 文档 进一步 说 明了 过 程 管理 、 作 业 属 性 等 信息 。 


RFC 2567 IPP 设计 目标 
RFC 2568 IPP 模型 与 协议 架构 的 基本 原理 


RFC 2911 IPP/1.1: 模型 与 语义 
RFC 2910 IPP/1.1: 编码 与 传输 
RFC 3196 IPP/1.1: 实现 者 指南 


图 21-1 基本 的 IPP 文档 
候选 标准 5100.12-2100 指明 实现 提供 的 所 有 功能 都 要 能 够 支持 符合 不 同 的 IPP 标准 版 本 。 有 
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许多 建议 性 的 IPP 协议 扩展 (具体 的 功能 在 IPP 相关 文档 中 定义 )。 将 这 些 功能 分 组 创建 出 不 同 的 
一 致 性 分 级 ; 每 一 级 是 一 个 不 同 的 协议 版 本 。 对 于 兼容 性 ， 每 个 更 高 的 一 致 性 级 别 要 符合 低 版 本 
定义 的 大 多 数 要 求 。 本 章 的 示例 中 使 用 的 是 IPP 1.1 版 本 。 

IPP 建立 在 超 文本 传输 协议 (Hypertext Transfer Protocol, HTTP) 之 上 (21.3 节 )。HTTP 又 
建立 在 TCP/IP Z LE. IPP 报 文 的 结构 如 图 21-2 所 示 。 


以 太 网 IP 
首部 首部 
21-2 IPP 报 文 结构 


IPP 是 请 求 响应 协议 。 客 户 端 发 送 请 求 到 服务 器 ， 服 务 器 用 响应 报 文 回答 这 个 请 求 。IPP 首部 
包含 一 个 域 来 指示 所 需 操 作 ， 这 些 操作 可 以 定义 成 提交 打印 作业 、 取 消 打印 作业 、 获 取 作 业 属 性 、 
获取 打印 机 属性 、 暂 停 和 重启 打印 机 、 挂 起 一 个 作业 和 释放 一 个 挂 起 的 作业 。 

图 21-3 显示 了 一 个 IPP 首部 的 结构 。 前 两 个 字 节 表 示 IPP 版 本 号 ， 对 于 1.1 版 本 协议 ， 每 个 
字 节 的 值 是 1。 对 于 一 个 请 求 协议 ， 接 下 来 两 个 字 节 包含 一 个 值 来 指示 请 求 操作 的 类 型 。 对 于 一 








TCP HTTP IPP 
首部 首部 首部 要 打印 的 数据 














个 响应 协议 ， 这 两 个 字 节 包含 一 个 状态 码 。 
号 (2 字 节 ) 
IF 操作 ID (请 求 )/ 状态 码 (响应 ) (2 字 节 ) 
上 == 
请 求 ID (4 字 节 ) 
RO RA EET 
属性 O-n zt) 
r rA 属性 结束 标志 ”| (1 字 节 ) 








E 21-3 IPP 首部 结构 

接 下 来 4 字 节 包含 一 个 整数 以 标识 请 求 ， 使 得 请 求 和 响应 相 匹 配 。 接 着 是 可 选 的 属性 ， 然 后 
用 属性 结束 标志 终止 。 紧 接着 属性 结束 标志 之 后 是 任何 与 请 求 相 关联 的 数据 。 

在 首部 ， 整 数 以 有 符号 二 进 制 补 码 以 及 大 端 字 节 序 〈 即 网 络 字 节 序 ) 方式 存储 。 属 性 按照 组 
来 存储 。 每 个 组 都 以 标识 该 组 的 一 个 字 节 开始 。 在 每 一 个 组 中 ， 属 性 通常 表示 为 : 1 字 节 的 标志 ， 
然后 是 2 字 节 属性 名 长 度 ， 接 着 是 属性 名 ， 然 后 是 2 字 节 属性 值 长 度 ， 最 后 是 属性 值 本 身 。 属 性 
值 可 以 编码 成 字符 串 、 二 进 制 整 数 或 者 更 为 复杂 的 结构 ， 如 日 期 /时 间 恰 。 

图 21-4 显示 了 attributes-charset 属性 是 如 何 编码 成 utf-8 类 型 的 值 的 。 





属性 标志 = 0x47 (1 字 节 ) 
PC 属性 名 长 度 =18 ——— o5) 
属性 名 =attributes-charset (18 字 节 ) 
ndr 属性 值 长度 =5 =| EH) 
i Rt | 6% 








21-4 IPP 属性 编码 样 例 
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根据 所 请 求 的 操作 ， 一 些 属性 需要 在 请 求 报 文 中 提供 ， 而 另 一 些 是 可 选 的 。 例 如 ， 图 12-5 显 
示 了 用 于 为 打印 作业 请 求 定 义 的 属性 。 





attributes-charset 必需 text 或 name 类 型 属性 所 使 用 的 字符 集 


attributes-natural-language 必需 text 或 name 类 型 属性 所 使 用 的 自然 语言 
printer-uri 必需 打印 机 的 统一 资源 标识 符 

requesting-user-name i 提交 作业 的 用 户 名 〈 如 果 可 以 ， 可 用 于 认证 ) 
job-name 选 用 于 区 别 多 个 作业 的 作业 名 
ipp-attribute-fidelity 选 如 果 为 真 ， 告 诉 打 印 机 如 果 属 性 不 匹配 就 拒绝 作业 ， 否 


则 ， 打 印 机 尽 可 能 打印 作业 

document-name j 文档 名 (如 适合 打印 一 个 旗 标 ) 

document-format 选 文档 格式 (如 纯 文本 、PostScript) 

document-natural-language i 文档 的 自然 语言 

compression 选 压缩 文档 的 算法 

job-k-octets 选 以 1024 字 节 单位 计算 的 文档 大 小 

job-impressions i EPEHA CRATE Xr nS PR 59 i 

job-media-sheets i 作业 打印 张 数 

图 21-5 打印 作业 请 求 的 属性 

IPP 首部 包含 了 文本 和 二 进 制 混合 数据 。 属 性 名 存储 为 文本 ， 而 数据 大 小 存储 为 二 进 制 整数 。 
这 使 得 构建 和 分 析 首 部 的 过 程 变 得 复杂 ， 因 为 需要 考虑 诸如 网 络 字 节 序 、 主 机 处 理 器 是 否 在 任意 
字 节 边界 编 址 对 齐 之 类 的 问题 。 一 个 较 好 的 可 选 方案 是 将 首部 设计 成 仅 包含 文本 。 这 样 以 稍微 膨 
胀 一 些 协议 报 文 为 代价 简化 处 理 过 程 。 


21.3” 超 文本 传输 协议 HTTP 


HTTP V1.1 由 RFC 2616 说 明 。HTTP 也 是 请 求 响应 协议 。 请 求 报 文 包含 的 一 个 开始 行 ， 跟 着 
是 首部 行 ， 接 着 是 空白 行 ， 然 后 是 一 个 可 选 的 实体 主体 。 在 我 们 这 种 情况 ， 实 体 主体 包含 IPP 首 
部 和 数据 。 

HTTP 首部 是 ASCII 63, 每 行 以 回 车 (\z) 和 换行 符 (\n) 结束 。 开 始 行 包含 一 个 method 
来 指示 客户 端 请 求 的 操作 、 一 个 统一 资源 定位 符 〈Uniform Resource Locator, URL) 来 描述 服 
务 器 和 协议 、 一 个 字符 串 来 表示 HTTP 版 本 。IPP 所 用 的 方法 仅 为 PoST， 用 于 将 数据 发 送 到 
服务 器 。 

首部 行 指定 属性 ， 如 实体 主体 的 格式 和 长 度 。 一 个 首部 行 包 含 一 个 属性 名 , 后 紧 随 一 个 冒号 ， 
接着 是 可 选 的 空格 符 ， 然 后 是 属性 值 ， 最 后 以 回 车 和 换行 符 结束 。 例 如 ， 为 了 指定 实体 主体 包含 
IPP 报 文 ， 应 包含 如 下 的 首部 行 : 

Content-Type: application/ipp 
下 面 是 对 于 作者 使 用 的 Xerox Phaser 8560 打印 机 的 打印 请 求 的 HTTP 首部 样 例 。 


POST /ipp HTTP/1.1^M 
Content-Length: 21931^M 
Content-Type: application/ipp^M 
Host: phaser8560:631^M 

^M 
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Content-Length 行 指 明了 HTTP 报 文中 数据 的 字 节 大 小 。 这 个 长 度 不 包含 了 HTTP 首部 的 大 
小 ， 但 包括 IPP 首部 的 大 小 。Host 行 指明 了 要 发 送 报 文 的 服务 器 主机 名 称 和 端口 号 。 

每 行 后 面 的 ^M 是 换行 符 前 的 回 车 符 。 换 行 符 不 能 被 显示 成 可 打印 字符 。 注意, 首部 的 最 后 一 
行 是 空 的 ， 只 有 回 车 和 换行 符 。 

HTTP 响应 报 文 的 起 始 行 包 含 了 版 本 字符 串 ， 紧 接着 的 是 一 个 数字 状态 码 和 状态 信息 ， 最 后 
以 一 个 回 车 和 换行 结束 。HTTP 响应 报 文 的 剩余 部 分 和 请 求 报 文 的 格式 一 样 : 首部 之 后 是 一 个 空 
白 行 和 可 选 的 实体 主体 。 

打印 机 需要 发 送 给 我 们 如 下 的 报 文 作为 打印 请 求 的 回应 : 

HTTP/1.1 200 OK^M 

Content-Type: application/ipp^M 

Cache-Control: no-cache, no-store, must-revalidate^M 

Expires: THU, 26 OCT 1995 00:00:00 GMT^M 

Content-Length: 215^M 

Server: Allegro-Software-RomPager/4.34^M 

^M 
对 于 打印 假 脱 机 守护 进程 ， 我 们 只 关心 报 文 的 第 一 行 : 它 说 明了 请 求 成 功 或 者 用 数字 错误 码 以 及 
一 个 短 字 符 串 表示 请 求 失败 。 剩 下 的 报 文 包含 了 附加 信息 ， 可 以 通过 在 客户 端 和 服务 器 间 的 节点 
来 控制 缓存 以 及 表明 运行 在 服务 器 上 的 软件 版 本 号 。 
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本 章 中 我 们 开发 的 程序 是 一 个 基本 的 打印 假 脱 机 守护 进程 。 一 个 简单 的 用 户 命令 发 送 一 个 文 
件 到 打印 假 脱 机 守护 进程 ， 假 脱 机 守护 进程 将 其 保存 到 磁盘 ， 将 请 求 送 入 队列 ， 最 终 将 文件 发 送 
到 打印 机 。 

所 有 的 UNIX 系统 至 少 提供 一 个 打印 假 脱 机 系统 。FreeBSD 安装 的 是 BSD 的 打印 假 脱 机 
系统 LPD( 人 参见 1pd(8) 和 Stevens [1990] 第 13 章 )。Linux 和 Mac OS X 包括 CUPS, Ef] Common 
UNIX Printing System (参见 cupsd(8)). Solaris 提供 标准 的 System V 打印 假 脱 机 守护 进程 ( 参 
JL 1P(D) 和 lpsched(1M))。 在 本 章 中 ， 我 们 的 兴趣 不 在 于 这 些 假 脱 机 系统 本 身 ， 而 是 如 何 与 
网 络 打印 机 通信 。 我 们 需要 开发 一 个 假 脱 机 系统 能 够 解决 多 用 户 访问 单一 资源 〈 打 印 机 ) 
问题 。 

我 们 使 用 一 个 简单 的 命令 行程 序 读 取 一 个 文件 ， 将 其 送 到 打印 假 脱 机 守护 进程 。 这 个 命令 
行程 序 由 一 个 选项 来 强制 将 文件 按照 文本 来 处 理 〈 默 认 是 PostScript 文件 )。 这 个 命令 行程 序 是 
print. 

在 我 们 的 打印 假 脱 机 守护 进程 printa 中 ， 使 用 多 线程 将 任务 分 解 给 守护 进程 来 完成 。 

。 一 个 线程 在 套 接 字 上 监听 从 运行 print 的 客户 端 发 来 的 新 打印 请 求 。 

。 对 于 每 个 客户 端 产生 一 个 独立 的 线程 ， 将 要 打印 的 文件 复制 到 假 脱 机 区 域 。 

。 一 个 线程 与 打印 机 通信 ， 一 次 发 送 一 个 队列 中 的 作业 。 

。 一 个 线程 处 理 信 号。 

图 21-6 显示 如 何 将 这 些 组 件 整合 在 一 起 。 

打印 配置 文件 是 /etc/printer .conf。 这 个 文件 标识 了 运行 打印 假 脱 机 守护 进程 的 服务 器 
主机 名 和 网 络 打印 机 的 主机 名 。 以 printserver 关键 字 开 始 的 行 标识 了 假 脱 机 守护 进程 。 以 
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printer 关键 字 开 始 的 行 标识 了 打印 机 ， 空 格 符 之 后 跟着 打印 机 的 主机 名 。 





图 21-6 打印 假 脱 机 组 件 
一 个 打印 机 配置 文件 样 例 可 能 包含 下 列 行 : 


printserver fujin 
printer phaser8560 


其 中 fujin 是 运行 打印 假 脱 机 守护 进程 的 计算 机 系统 主机 名 ，phaser8560 是 网 络 打印 机 的 主 
机 名 。 我 们 假设 这 些 名 字 已 经 在 /etc/hosts 中 列 出 或 者 已 经 通过 正在 使 用 的 任意 服务 进行 了 注 
册 ， 这 样 我 们 就 可 以 将 这 些 名 字 转 换 成 网 络 地 址 。 
可 以 在 运行 打印 假 脱 机 守护 进程 的 同一 台 机 器 上 运行 print 命令 ， 也 可 以 在 同一 个 网 络 中 
的 任意 机 器 上 运行 它 。 我 们 只 需 配 置 在 /etc/printer.conf 中 的 printserver 字段 即 可 ， 
因为 只 有 守护 进程 需要 知道 打印 机 名 称 。 
安全 
拥有 超级 用 户 特权 的 程序 可 能 让 计算 机 系统 受到 攻击 。 这 些 程序 通常 并 不 比 其 他 程序 更 脆 
弱 ， 但 是 被 攻破 时 将 导致 攻击 者 能 够 完全 访问 你 的 计算 机 系统 。 
本 章 中 的 打印 假 脱 机 守护 进程 拥有 超级 用 户 特 权 , 在 这 个 例子 中 能 够 将 一 个 特权 TCP 端口 号 
绑 定 一 个 套 接 字 。 为 了 使 守护 进程 能 更 好 地 抵御 攻击 ， 我 们 可 以 : 
。 按照 最 少 特 权 的 原则 (8.11 节 ) 设计 守护 进程 。 我 们 获得 一 个 绑 定 到 特权 端口 的 套 接 字 
之 后 ， 可 以 将 守护 进程 的 用 户 ID 和 组 的 ID 更 改 为 非 root (如 lp)。 所 有 用 于 存储 队列 
中 打印 作业 的 文件 和 目录 的 拥有 者 应 该 是 非特 权 用 户 。 如 果 被 攻击 ， 这 种 情况 下 攻击 者 
只 能 通过 守护 进程 访问 打印 子 系统 。 虽 然 这 仍然 是 一 个 隐患 ， 但 是 比 起 攻击 者 可 以 完全 
访问 系统 ， 其 危害 性 已 大 大 降低 了 。 
。 审计 守护 进程 源 代码 中 所 有 已 知 的 潜在 脆弱 性 漏洞 ， 如 缓冲 区 溢出 。 
。 对 不 期 望 或 者 可 疑 的 行为 做 日 志 ， 这 样 可 以 引起 管理 员 注 意 并 进一步 调查 。 


21.5 源 代码 


本 章 的 源 代码 有 5 个 文件 ， 不 包括 在 前 面 章节 中 所 用 的 一 些 公共 库 例 程 。 

ipp.h 包含 IPP 定义 的 头 文件 。 

print.h 包含 公用 的 常数 、 数 据 结构 定义 以 及 实用 工具 例 程 的 声明 的 头 文件 。 
wesc 用 于 两 个 程序 的 实用 工具 例 程 。 





print.c 
printd.c 
我 们 按照 所 列 次 序 依次 分 析 每 个 文件 。 
首先 从 ipp.h 头 文 件 开 始 。 





用 于 打印 文件 的 命令 行程 序 C 代码 。 
用 于 打印 假 脱 机 守护 进程 的 C 代码 。 


<= 0x00ff) 
= 0x01ff) 
<= 0x03ff) 
<= 0x04ff) 
<= 0x05ff) 


some attrs ignored */ 
some attrs conflicted */ 


invalid client request */ 


authentication required */ 


no object found for URI */ 


object no longer available */ 
requested entity too big */ 
attribute value too large */ 


unsupported doc format */ 


attributes not supported */ 
URI scheme not supported */ 


compression not supported */ 
data can't be decompressed */ 
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ipp.h 从 标准 的 #ifdef 开始 ， 用 于 防止 同一 文件 被 包含 两 次 的 错误 。 然后 定义 IPP 


1 #ifndef _IPP_H 

2 #define _IPP_H 

3 g= 

4 * Defines parts of the IPP protocol between the scheduler 

5 * and the printer. Based on RFC2911 and RFC2910. 

6 if 

7 /* 

8 * Status code classes. 

9 wy. 

10 #define STATCLASS OK (x) ((x) >= 0x0000 && (x) 

11 #define STATCLASS_INFO(x) ((x) >= 0x0100 && (x) 

12 #define STATCLASS_REDIR (x) ((x) >= 0x0300 && (x) 

13 #define STATCLASS_CLIERR (x) ((x) >= 0x0400 && (x) 

14 #define STATCLASS SRVERR (x) ((x) >= 0x0500 && (x) 

15. 7* 

16 * Status codes. 

17 tz 

18 #define STAT_OK 0x0000 /* success */ 

19 #define STAT OK ATTRIGN  0x0001 /* OK; 

20 #define STAT OK ATTRCON 0x0002 /* OK; 

21 #define STAT CLI BADREQ 0x0400 /* 

22 #define STAT CLI FORBID  0x0401 /* request is forbidden */ 
23 #define STAT CLI NOAUTH 0x0402 /* 

24 #define STAT CLI NOPERM  0x0403 /* client not authorized */ 
25 #define STAT CLI NOTPOS  0x0404 /* request not possible */ 
26 #define STAT CLI TIMOUT  0x0405 /* client too slow */ 

21 #define STAT CLI NOTFND 0x0406 /* 

28 #define STAT CLI OBJGONE 0x0407 /* 

29 #define STAT CLI TOOBIG 0x0408 /* 

30 +#define STAT CLI TOOLNG 0x0409 /* 

31 #define STAT CLI BADFMT 0x040a /* 

32 #define STAT CLI NOTSUP Ox040b /* 

33 #define STAT CLI NOSCHM 0x040c /* 

34 #define STAT CLI NOCHAR 0x040d /* charset not supported */ 
35 #define STAT CLI ATTRCON 0x040e /* attributes conflicted */ 
36 +#define STAT CLI NOCOMP  O0x040f /* 

37 #define STAT CLI COMPERR 0x0410 /* 

38 #define STAT CLI FMTERR  0x0411 /* document format error */ 
39  4define STAT CLI ACCERR  0x0412 /* error accessing data */ 
[1 一 14] 

状态 码 的 类 (参见 RFC 2911 的 第 13 节 )。 

[15—39] ”定义 基于 RFC 2911 的 状态 码 ， 但 是 本 程序 不 使 用 ， 这 些 状态 码 的 使 用 留 给 读者 作为 


练习 (参见 习题 21.1 )。 


40 #define STAT_SRV_INTERN 





0x0500 /* unexpected internal error */ 


796 
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41 
42 
43 
44 
45 
46 
47 
48 
49 


50 
51 
52 
53 
54 
55 
56 
57 
58 
59 
60 
61 
62 
63 
64 
65 
66 
67 
68 


69 
70 
71 
72 
13 
74 
75 
76 


#define STAT SRV NOTSUP 0x0501 /* operation not supported */ 
#define STAT SRV UNAVAIL  0x0502 /* service unavailable */ 
#define STAT SRV BADVER 0x0503 /* version not supported */ 
#define STAT SRV DEVERR 0x0504 /* device error */ 

#define STAT SRV TMPERR 0x0505 /* temporary error */ 

#define STAT SRV REJECT 0x0506 /* server not accepting jobs */ 
#define STAT SRV TOOBUSY  0x0507 /* server too busy */ 

#define STAT SRV CANCEL 0x0508 /* job has been canceled */ 
#define STAT SRV NOMULTI  0x0509 /* multi-doc jobs unsupported */ 


/* 
* Operation IDs 
ud 
#define OP PRINT JOB 0x02 
#define OP PRINT URI 0x03 
#define OP VALIDATE JOB 0x04 
#define OP CREATE JOB 0x05 
#define OP SEND DOC 0x06 
#define OP SEND URI 0x07 
#define OP CANCEL JOB 0x08 
#define OP GET JOB ATTR 0x09 
#define OP GET JOBS 0x0a 
#define OP GET PRINTER ATTR 0x0b 
#define OP_HOLD_JOB OxOc 
#define OP RELEASE JOB 0x0d 
#define OP_RESTART_JOB Ox0e 
#define OP_PAUSE_PRINTER 0x10 
‘#define OP RESUME PRINTER 0x11 
#define OP_PURGE_JOBS 0x12 
/* 
* Attribute Tags. 
*/ 
#define TAG OPERATION ATTR 0x01 /* operation attributes tag */ 
#define TAG JOB ATTR 0x02 /* job attributes tag */ 
#define TAG END OF ATTR 0x03 /* end of attributes tag */ 
#define TAG PRINTER ATTR 0x04 /* printer attributes tag */ 
#define TAG UNSUPP ATTR 0x05 /* unsupported attributes tag */ 


[40—49] ”继续 定义 状态 码 。0x500 一 0x5ff 是 服务 器 错误 码 。RFC 2911 中 13.1.1 "528 13.1.5 


节 描述 了 所 有 的 状态 码 。 


[50 一 68] ”接着 定义 各 种 操作 I 了 ID。IPP 中 定义 的 每 个 操作 有 一 个 ID( 参 见 RFC 2911 ff] 4.4.15 节 )。 


在 本 例 中 ， 仅 用 到 打印 作业 操作 。 


[69—76] ”属性 标志 限定 了 IPP 中 请 求 和 响应 报 文 的 属性 组 。 这 些 值 定义 在 RFC 2910 的 3.5.1 节 。 


WE 
78 
79 
80 
81 
82 
83 
84 
85 


/* 

* Value Tags. 

ey 

#define TAG UNSUPPORTED 0x10 /* unsupported value */ 
#define TAG UNKNOWN 0x12 /* unknown value */ 
#define TAG NONE 0x13 /* no value */ 

#define TAG INTEGER 0x21 /* integer */ 

#define TAG BOOLEAN 0x22 /* boolean */ 


#define TAG_ENUM 0x23 /* enumeration */ 
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86 #define TAG_OCTSTR 0x30 /* octetString */ 

87 #define TAG DATETIME 0x31 /* dateTime */ 

88 #define TAG RESOLUTION 0x32 /* resolution */ 

89 #define TAG INTRANGE 0x33 /* rangeOfInteger */ 

90 #define TAG TEXTWLANG 0x35 /* textWithLanguage */ 

91 #define TAG NAMEWLANG 0x36 /* nameWithLanguage */ 

92 #define TAG TEXTWOLANG 0x41 /* textWithoutLanguage */ 

93 #define TAG NAMEWOLANG 0x42 /* nameWithoutLanguage */ 

94 #define TAG KEYWORD 0x44 /* keyword */ 

95 +#define TAG URI 0x45 /* URI */ 

96 #define TAG URISCHEME 0x46 /* uriScheme */ 

97 #define TAG CHARSET 0x47 /* charset */ 

98 #define TAG NATULANG 0x48 /* naturalLanguage */ 

99 #define TAG MIMETYPE 0x49 /* mimeMediaType */ 

100 struct ipp hdr 1 

101 int8 t major version; /* always 1 */ 

102 int8 t minor version; /* always 1 */ 

103 union ( 

104 intl6 t op; /* operation ID */ 

105 intl6 t st; /* status */ 

106 V wy 

107 int32 t request id; /* request ID */ 

108 char attr group[1]; /* start of optional attributes group */ 

109 /* optional data follows */ 

110 by 

111 #define operation u.op 

112 +#define status u.st 

113 #endif /* _IPP_H */ 

[77 一 99] 值 标志 指示 每 个 属性 和 参数 的 格式 ， 由 RFC 2910 的 3.5.2 节 定 义 。 

[100—113] ”定义 IPP 首部 的 结构 。 请 求 报 文 与 响应 报 文 的 首部 一 样 ， 除 了 请 求 中 的 操作 ID 被 
响应 中 的 状态 码 代替 。 
在 头 文件 尾部 我 们 用 #enqif 来 匹配 文件 开始 的 #ifdef。 

下 一 个 文件 是 print.h 头 文件 。 

1 #ifndef PRINT H 

2 #define PRINT H 

3 gt 

4 * Print server header file. 

5 */ 

6 #include <sys/socket.h> 

7 #include <arpa/inet.h> 

8 +#include «netdb.h» 

9 #include <errno.h> 

10 #define CONFIG_FILE "/etc/printer.conf" 

11 +#define SPOOLDIR "/var/spool/printer" 

12 #define JOBFILE "jobno" 

13 #define DATADIR "data" 

14 #define REQDIR "reqs" 
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15 #if defined(BSD) 

16 #define LPNAME "daemon" 

17 #elif defined (MACOS) 

18 #define LPNAME " lp* 

19 #telse 

20 #define LPNAME "lp" 

21 #endif 

[1 一 9] 在 这 个 头 文件 中 包含 所 需要 的 所 有 头 文件 。 应 用 程序 只 需 简 单 地 包含 print.h， 而 
不 需要 跟踪 所 有 的 头 文件 依赖 关系 。 

[10 一 14] ”定义 实现 所 需 的 文件 和 目录 。 包 含 打 印 守护 进程 和 网 络 打 印 机 主机 名 的 配置 文件 在 
/etc/printer.conf 中 。 需 要 打印 的 文件 副本 在 目录 /var/spool/printer/ 
data 中 ; 对 于 每 个 请 求 的 控制 信息 在 目录 /var/spool/printer/reqs 中 。 包 含 
下 一 个 作业 编号 的 文件 是 /var/spool/printer/jobno。 
目录 必须 由 管理 员 创建 并 且 由 运行 打印 守护 进程 的 账户 所 有 。 如 果 这 些 目 录 不 存在 ， 
守护 进程 也 不 会 创建 这 些 目 录 ， 因 为 守护 进程 需要 root 权限 来 创建 /var/spool 
中 的 目录 ,我 们 的 设计 初衷 是 当 以 root 权限 运行 时 , 尽量 让 守护 进程 少 做 一 些 事情 ， 
以 减少 产生 安全 漏洞 的 可 能 。 

[15~21] ”接着 定义 运行 打印 守护 进程 的 账户 名 。 在 Linux 和 Solaris 中 ， 这 个 账户 名 是 1p。 在 
Mac OS X'h, KP Jé 1p. FreeBSD 没有 为 打印 守护 进程 定义 单独 的 账户 ， 所 以 
我 们 使 用 为 系统 守护 进程 保留 的 账户 。 

22 #define FILENMSZ 64 

23 #tdefine FILEPERM (S IRUSR|S IWUSR) 

24 #define USERNM MAX 64 

25 #define JOBNM MAX 256 

26 #define MSGLEN MAX 512 

27 #ifndef HOST NAME MAX 

28 #define HOST NAME MAX 256 

29 #endif 

30 #define IPP PORT 631 

31 #define QLEN 10 

32 #define IBUFSZ 512  /* IPP header buffer size */ 

33 #define HBUFSZ 512 /* HTTP header buffer size */ 

34 #define IOBUFSZ 8192 /* data buffer size */ 

35 #ifndef ETIME 

36 #define ETIME ETIMEDOUT 

37 #endif 

38 extern int getaddrlist(const char *, const char *, 

39 struct addrinfo **); 

40 extern char *get_printserver (void); 

41 extern struct addrinfo *get_printaddr (void) ; 

42 extern ssize_t tread(int, void *, size_t, unsigned int); 

43 extern ssize_t treadn(int, void *, size_t, unsigned int); 

44 extern int connect_retry(int, int, int, const struct sockaddr *, 
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45 socklen t); 
46 extern int initserver(int, const struct sockaddr *, socklen t, 
47 int); 


[22—34] ” 接 下 来 定义 限制 和 常量 。FILEPERM 是 创建 要 打印 的 文件 副本 使 用 的 权限 。 这 个 权限 


是 被 限制 的 ， 因 为 我 们 不 希望 普通 用 户 在 等 待 打 印 时 能 够 读 取 他 人 的 文件 。 我 们 定义 
HOST_NAME_MAX 作为 用 sysconf 不 能 够 确定 系统 的 限制 时 能 够 支持 的 最 大 的 主机 名 。 
IPP 被 定义 为 使 用 端口 631.QLEN 是 传递 给 listen 的 backlog 参数 (具体 细节 见 16.4 节 )。 

[35 一 37] ”一 些 平台 没有 定义 错误 码 ETIME, 因此 另外 定义 一 个 错误 码 , 使 得 在 这 些 系 统 上 有 意 
义 。 当 读 超时 时 ， 返 回 这 个 错误 码 (我 们 不 希望 在 从 套 接 字 读 的 时 候 服 务 器 无 限期 地 
阻塞 )。 

[38 一 47] ”接着 , 定义 所 有 包含 在 util.c 中 的 公共 例 程 ( 稍 后 将 分 析 这 些 例 程 )。 注 意 , 图 16-11 
中 的 connect_retry 函数 和 图 16-22 中 的 initserver 函数 没有 包含 在 util.c 中 。 


48 /* 

49 * Structure describing a print request. 

50  */ 

51 struct printreq { 

52 uint32 t size; /* size in bytes */ 

53 uint32 t flags; /* see below */ 

54 char usernm[USERNM MAX]; /* user's name */ 

55 char jobnm[JOBNM MAX]; /* job's name */ 

56. jj 

57 /* 

58 * Request flags. 

59. */ 

60 #define PR TEXT 0x01 /* treat file as plain text */ 
6L g% 

62 * The response from the spooling daemon to the print command. 
63  */ 

64 struct printresp ( 

65 uint32 t retcode; /* 0-success, !0=error code */ 
66 uint32 t jobid; /* job ID */ 

67 char msg[MSGLEN MAX]; /* error message */ 

68 ); 


69 #endif /* PRINT H */ 


[48—69] | printreq 结构 和 printresp 结构 定义 了 print 程序 和 打印 假 脱 机 守护 进程 之 间 


的 协议 。print 程序 发 送 printreq 结构 到 打印 假 脱 机 守护 进程 ， 该 结构 定义 了 作 
业 大 小 《以 字 节 为 单位 )、 作 业 性 质 、 用 户 名 和 作业 名 。 打 印 假 脱 机 守护 进程 用 
printresp 结构 回应 ， 该 结构 包括 返回 码 、 作 业 ID 和 错误 消息 (如 果 请 求 失败 )。 
PR TEXT 作业 性 质 表明 要 打印 的 文件 只 能 被 视 为 纯 文本 《〈 而 不 是 PostScript). BNA 
所 有 的 标志 定义 一 个 掩 码 而 非 对 每 个 标志 定义 一 个 独立 的 字段 。 尽 管 目 前 只 定义 了 一 
个 标志 值 ， 将 来 还 可 以 增加 更 多 性 质 来 扩展 这 个 协议 。 例 如 ， 我 们 可 以 在 增加 一 个 标 
志 位 用 来 请 求 双 面 打印 。 不 需要 改变 结构 的 大 小 就 可 以 有 31 个 额外 的 标志 位 的 空间 。 
改变 结构 的 大 小 意味 着 可 能 会 引入 客户 端 和 服务 器 的 兼容 性 问题 ， 除 非 对 两 边 同 时 更 
新 。 另 一 个 可 选 方案 就 是 增加 一 个 报 文 版 本 号 ， 以 允许 不 同 版 本 的 结构 有 所 改变 。 
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下 


#4 
#i 
#i 
#i 


A wN 


注意 ， 对 协议 结构 中 的 所 有 整数 显 式 地 定义 了 一 个 长 度 ， 这 可 以 在 客户 端 与 服务 器 
的 整数 长 度 不 同时 避免 错位 的 结构 元 素 。 
一 个 文件 我 们 考察 util.c， 该 文件 包含 实用 工具 例 程 。 


nclude "apue.h" 
nclude "print.h" 
nclude <ctype.h> 
nclude <sys/select.h> 


#define MAXCFGLINE 512 
6 #define MAXKWLEN 16 
7 #define MAXFMTLEN 16 


g- of? 

9 * Get the address list for the given host and service and 
10 * return through ailistpp. Returns 0 on success or an error 
11 * code on failure. Note that we do not set errno if we 

12 * encounter an error. 

i 

14 * LOCKING: none. 

15. */ 

16 int 


17 getaddrlist(const char *host, const char *service, 


18 
19 1 


struct addrinfo **ailistpp) 


int err; 
struct addrinfo hint; 


hint.ai flags = AI CANONNAME; 

hint.ai family = AF INET; 

hint.ai socktype - SOCK STREAM; 

hint.ai protocol = 0; 

hint.ai addrlen = 0; 

hint.ai canonname - NULL; 

hint.ai addr = NULL; 

hint.ai next = NULL; 

err - getaddrinfo(host, service, &hint, ailistpp); 
return(err); 


首先 定义 了 这 个 文件 中 函数 中 的 限制 。 MAXCFGLINE 是 打印 机 配置 文件 的 行 的 最 大 长 
度 、MAXKWLEN 是 配置 文件 中 关键 字 的 最 大 长 度 、MAXFMTLEN 是 传 给 sscanf 的 格 
式 化 字符 串 的 最 大 长 度 。 


[8 一 32] ”第 一 个 函数 是 getaddrlist, Æ getaddrinfo (16.3.3 节 ) 的 封装 ， 因 为 我 们 常常 


用 同样 的 结构 来 调用 getaddrinfo。 注 意 ， 在 这 个 函数 中 不 需要 互 斥 锁 。 每 个 函数 
前 面 的 LOCKING 注释 是 用 于 多 线程 锁定 的 文档 编号。 这 一 注释 列 出 了 可 能 的 关于 锁 
的 假设 ， 告 知 该 函数 所 需要 获得 或 释放 的 锁 ， 并 告知 调用 这 个 函数 所 需要 持 有 的 锁 。 


33°. J* 

34 * Given a keyword, scan the configuration file for a match 
35  * and return the string value corresponding to the keyword. 
3G * 

37 * LOCKING: none. 





38 
39 
40 
41 
42 
43 
44 
45 
46 


47 
48 
49 
50 
51 
52 
53 
54 
55 
56 
57 
58 
59 
60 
61 
62 
63 
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wi 
static char * 
scan_configfile(char *keyword) 


{ 


int n, match; 

FILE efor 

char keybuf [MAXKWLEN], pattern[MAXFMTLEN]; 
char line [MAXCFGLINE]; 

static char valbuf [MAXCFGLINE]; 

if ((fp = fopen(CONFIG FILE, "r")) == NULL) 


log sys("can't open $s", CONFIG FILE); 
sprintf (pattern, "%%%ds %%%ds", MAXKWLEN-1, MAXCFGLINE-1); 


match - 0; 
while (fgets(line, MAXCFGLINE, fp) !- NULL) { 
n = sscanf(line, pattern, keybuf, valbuf); 
if (n == 2 && strcmp(keyword, keybuf) == 0) ( 
match = 1; 
break; 


) 
) 
fclose (fp); 
if (match != 0) 
return(valbuf); 
else 
return (NULL); 
} 


[33—46] | scan configfile 函数 搜索 打印 机 配置 文件 中 指定 的 关键 字 。 
[47~63] ”以 读 方式 打开 配置 文件 ， 根 据 搜索 模式 建立 格式 字符 串 。 符 号 8%%%ds 建立 一 个 格式 


64 
65 
66 
67 
68 
69 
70 
71 
72 
73 


74 
75 
76 
77 


指示 器 来 限定 字符 串 长 度 ， 这 样 在 栈 中 存放 字符 串 的 缓冲 区 就 不 会 溢出 。 在 文件 中 一 次 
读 取 一 行 ， 并 且 扫 描 被 空格 符 分 开 的 两 个 字符 串 ， 如 果 找 到 它们 ， 就 用 关键 字 与 第 一 个 
字符 串 比 较 。 如 果 找 到 一 个 匹配 或 者 读 到 文件 尾 ， 则 循环 结束 并 关闭 文件 。 如 果 关 键 字 
匹配 ， 则 返回 一 个 指向 包含 关键 字 后 面 的 字符 串 的 缓冲 区 的 指针 ， 和 否则 返回 NULL。 
返回 的 字符 串 存放 在 静态 缓冲 区 〈valbuf) 中 ， 该 缓冲 区 会 被 紧 接 的 调用 覆盖 。 因 
此 ，scan_configfile 不 能 用 于 多 线程 程序 ， 除 非 能 够 小 心地 避免 同时 有 多 个 线 
程 调 用 它 。 
/* 


* Return the host name running the print server or NULL on error. 


* 

* LOCKING: none. 

*/ 
char * 
get printserver(void) 
{ 


return (scan_configfile("printserver") ); 


/* 
* Return the address of the network printer or NULL on error. 


* 


* LOCKING: none. 
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TE *y 
79 struct addrinfo * 
80 get_printaddr (void) 





81 { 

82 int err; 

83 char epi 

84 struct addrinfo *ailist; 

85 if ((p = scan configfile("printer")) != NULL) { 

B6 if ((err = getaddrlist(p, "ipp", &ailist)) != 0) { 

87 log msg("no address information for $s", p); 

88 return (NULL); 

89 } 

90 return (ailist); 

91 } 

92 log_msg("no printer address specified"); 

93 return (NULL); 

94 } 

[64—73] get_printserver 仅仅 是 一 个 简单 的 函数 封装 函数 ， 它 通过 调用 scan_configfile 
找到 运行 打印 假 脱 机 守护 进程 的 计算 机 系统 名 。 

[74 一 94] 使 用 get printaddr 函数 找到 网 络 打印 机 的 地 址 。 除 了 通过 配置 文件 中 的 打印 机 
名 找到 相应 的 网 络 地 址 之 外 ， 该 函数 与 前 面 的 函数 类 似 。 
get printserver fll get_printaddr 均 调用 scan configfile. WRA ETT 
开打 印 机 配置 文件 ，scan_configfile 就 调用 1og_sys 打印 出 错 消息 并 退出 。 尽 
管 get printserver 由 客户 端 命 令 调 用 ，get_printaddr 由 守护 进程 程序 调用 ， 
但 两 者 均 可 调用 1og_sys， 因 为 通过 设置 一 个 全 局 变量 可 以 安排 日 志 函 数 将 其 打印 
到 标准 错误 ， 而 不 是 输出 到 日 志文 件 。 

95. ,ts 


96 * "Timed" read - timout specifies the # of seconds to wait before 
97 * giving up (5th argument to select controls how long to wait for 


98 * data to be readable). 


99 * 
100 * LOCKING: none. 
101 *y 


102 ssizet 


Returns # of bytes read or -1 on error. 


103 tread(int fd, void *buf, size t nbytes, unsigned int timout) 


104 { 

105 int nfds; 
106 fd set readfds; 
107 struct timeval tv; 

108 tv.tv sec - timout; 

109 tv.tv usec - 0; 

110 FD ZERO(&readfds); 

111 FD SET(fd, &readfds); 
112 nfds = select (fd+1, &readfds, NULL, 
i05 if (nfds <= 0) { 

114 if (nfds == 0) 

115 errno = ETIME; 
116 return (-1); 


NULL, &tv); 


118 
119 


[95 一 107] | tread 的 函数 读 取 指 定 的 字 节 数 ， 在 放弃 以 前 至 多 阻塞 timout 秒 。 当 我 们 从 一 个 


} 
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return(read(fd, buf, nbytes)); 


套 接 字 或 一 个 管道 读数 据 时 这 个 函数 很 有 用 。 如 果 在 指定 的 时 间 期 限 内 没有 接收 数 
据 ， 返 回 -1 并 将 errno 设 为 ETIME。 如 果 在 时 间 期 限 内 有 数据 可 用 ， 返 回 最 多 
nbytes 字 节 的 数据 , 但 是 如 果 数 据 没 有 及 时 到 达 , 我 们 可 以 返回 比 要 求 的 少 的 数据 。 
我 们 用 tread 在 打印 假 脱 机 守护 进程 上 防止 拒绝 服务 攻击 。 一 个 恶意 用 户 可 能 重 
复 尝试 连接 到 守护 进程 而 不 发 送 数 据 , 只 是 为 了 阻止 其 他 用 户 提 交 打 印 作 业 。 通过 
一 个 合理 时 间 内 放弃 的 方式 , 我 们 防止 这 种 情况 发 生 。 其 巧妙 之 处 在 于 选择 一 个 合 
理 的 超时 值 ， 当 系统 负载 比较 低 和 任务 花费 更 长 时 间 时 ， 该 值 足够 大 能 够 防止 过 早 
天 折 。 如 果 我 们 选择 的 值 太 大 , 通过 允许 守护 进程 程序 消耗 太 多 资源 去 处 理 挂 起 请 
求 ， 可 能 导致 拒绝 服务 攻击 。 


[108 一 119] ”使 用 select 等 待 指定 的 文件 描述 符 可 读 。 如 果 在 要 读 取 的 数据 可 用 之 前 超时 ， 


146 


/* 


* 
* 
* 


* 


select 返回 0， 这 种 情况 将 errno WX ETIME, WR select 失败 或 超时 ， 返 
[p]—1; 否则 返回 任何 可 用 数据 。 


"Timed" read - timout specifies the number of seconds to wait 
per read call before giving up, but read exactly nbytes bytes. 
Returns number of bytes read or -1 on error. 


LOCKING: none. 


£y 
ssize t 
treadn(int fd, void *buf, size t nbytes, unsigned int timout) 


{ 


} 


size_t nleft; 
ssize_t nread; 
nleft = nbytes; 
while (nleft > 0) { 
if ((nread = tread(fd, buf, nleft, timout)) < 0) { 
if (nleft == nbytes) 
return (-1); /* error, return -1 */ 
else 
break; /* error, return amount read so far */ 
) else if (nread == 0) { 
break; /* ‘EOF */ 
} 
nleft -= nread; 
buf += nread; 
} 
return(nbytes - nleft); /* return »- 0 */ 


[120—146] “还 提供 了 tread 的 变 体 treadn， 它 仅 读 取 指 定 的 字 节 数 。 这 和 14.7 节 中 描述 的 


readn 类 似 ， 但 是 附加 了 一 个 超时 参数 。 

为 了 正好 读 取 nbytes FA, 必须 进行 多 次 read 调用 。 其 困难 之 处 在 于 尝试 将 单个 
超时 值 应 用 到 多 个 read 调用 。 这 里 不 想 用 闹钟 ， 因 为 在 多 线程 应 用 中 信和 号 会 变 乱 ; 

也 不 能 依赖 系统 根据 select 的 返回 更 新 timeval 结构 ， 以 指示 剩余 的 时 间 ， 因 为 


805 
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许多 平台 不 支持 这 个 〈14.5.1 节 )。 因 此 ， 这 种 情况 需要 折 中 并 定义 一 个 超时 值 应 用 到 
单独 的 read 调用 。 它 限制 循环 中 每 次 迭代 的 等 待 时 间 ， 而 不 是 限制 总 的 等 待 时 间 。 
总 等 待 的 最 大 时 间 由 nbytes X timout 秒 限定 〈 最 坏 情况 下 ， 一 次 仅 接收 一 个 字 节 )。 
用 nleft 记录 要 读 取 的 剩余 字 节 数 。 如 果 tread 失败 并 在 上 一 个 迭代 中 已 经 接 
收 到 数据 ， 则 停止 while 循环 并 返回 读 取 的 字 节 数 ;， 否则 返回 一 1。 

接 下 来 是 用 于 提交 打印 作业 的 命令 程序 。C 源 代码 文件 是 print.c. 





wo OA DW FWD D| 


PPK 
NF o 


13 


/* 

* The client command for printing documents. Opens the file 
* and sends it to the printer spooling daemon. Usage: 

* print [-t] filename 

* 

#include "apue.h" 

#include "print.h" 

#include «fcntl.h» 

#include «pwd.h» 


/* 

* Needed for logging funtions. 
xf 

int log_to_stderr = 1; 


void submit_file(int, int, const char *, size_t, int); 


int 
main(int argc, char *argv[]) 
{ 
int fd, sockfd, err, text, c; 
struct stat sbuf; 
char *host; 
struct addrinfo *ailist, *aip; 


err = 0; 
text = 0; 
while ((c = getopt(argc, argv, "t")) !- -1) { 
switch (c) ( 
case 't': 
text = 1; 
break; 


[1 一 14] ”需要 定义 一 个 1og_to_stderr 整数 ， 通 过 这 个 整数 能 够 使 用 库 中 的 日 志 函 数 。 如 


果 该 整数 设 为 非 0 值 ， 错 误 消 息 将 被 送 到 一 个 标准 错误 流 而 非 日 志文 件 中 。 尽 管 在 
print.c 中 没有 使 用 任何 日 志 函 数 ， 但 将 util.o 链接 到 print.o 构建 了 一 个 可 
执行 的 print 命令 ， 并 且 util.c 包含 用 于 用 户 命令 行程 序 和 守护 进程 的 函数 。 


[15~33] ”支持 一 个 选项 , 即 -t, 强行 使 文件 按照 文本 格式 打印 (而 不 是 其 他 格式 , 如 PostScript 


格式 )。 使 用 getopt 函数 来 处 理 命令 选项 。 
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34 if (err || (optind != argc - 1)) 

35 err quit("usage: print [-t] filename"); 

36 if ((fd = open(argv[optind], O RDONLY)) < 0) 

31 err Sys("print: can't open $s", argv[optind]); 

38 if (fstat(fd, &sbuf) « O) 

39 err sys("print: can't stat %s", argv[optind]); 

40 if (!S ISREG(sbuf.st mode)) 

41 err quit("print: $s must be a regular file\n", argv[optind]); 

42 Ae 

43 * Get the hostname of the host acting as the print server. 

44 */ 

45 if ((host = get printserver()) == NULL) 

46 err quit("print: no print server defined"); 

47 if ((err = getaddrlist(host, "print", &ailist)) !- 0) 

48 err quit("print: getaddrinfo error: $s", gai strerror(err)); 

49 for (aip = ailist aip != NULL; aip = aip-»ai next) { 

50 if ((sfd = connect retry(AF INET, SOCK STREAM, 0, 

51 aip-»ai addr, aip-»ai addrlen)) < 0) { 

52 err = errno; 

[34~41] “4 getopt 处 理 完 命令 选项 ， 将 变量 optind 设 为 指向 第 一 个 非 选项 参数 的 下 标 。 
如 果 这 是 一 个 值 而 非 最 后 一 个 参数 的 下 标 , 那么 说 明 它 是 错误 的 参数 个 数 (只 支持 一 
个 非 选项 参数 )。 错 误 处 理 包括 : 检查 是 否 能 够 打开 要 打印 的 文件 ， 检 查 是 否 是 一 个 
常规 文件 〈 而 不 是 一 个 目录 或 者 其 他 类 型 的 文件 )。 

[42—48] ”通过 调用 util.c 中 的 get_printserver 函数 取得 打印 假 脱 机 守护 进程 名 ， 并 且 
调用 getaddrlist (也 在 util.c 中) 将 主机 名 转换 成 一 个 网 络 地址 。 
注意 ， 指 定 服务 名 为 “print”。 在 系统 上 安装 打印 假 脱 机 守护 进程 时 ， 需 要 确保 
/etc/services (或 等 价 的 数据 库 ) 有 打印 机 服务 的 条 目 。 当 为 守护 进程 选择 一 个 
端口 时 ， 最 好 选择 特权 端口 ， 以 防止 恶意 用 户 程序 假装 成 一 个 打印 假 脱 机 守护 进程 ， 
而 实际 上 是 要 偷 取 打 印 文件 的 副本 。 这 意味 着 端口 号 应 小 于 1024 (回忆 16.3.4 节 )， 
并 且 守 护 进程 运行 时 必须 具有 超级 用 户 特权 以 便 能 够 绑 定 一 个 保留 端口 。 

[49—52] ”使 用 getaddrinfo 返回 的 地 址 列表 来 尝试 连接 到 守护 进程 ,然后 使 用 能 够 连接 的 第 
一 个 地 址 发 送 文件 到 守护 进程 。 

53 } else I 

54 submit_file(fd, sfd, argv[optind], sbuf.st_size, text); 

55 exit (0); 

56 } 

57 } 

58 err_exit(err, "print: can’t contact %s", host); 

59 i} 

60 /* 

61 * Send a file to the printer daemon. 

62 +y 

63 void 

64 submit_file(int fd, int sockfd, const char *fname, size_t nbytes, 

65 int text) 

66 

67 int nr, nw, len; 

68 struct passwd *pwd; 

69 struct printreq req; 
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70 struct printresp res; 

231 char buf [IOBUFSZ]; 

72 /* 

73 * First build the header. 

74 ay 

75 if ((pwd = getpwuid(geteuid())) == NULL) { 

76 strcpy(req.usernm, "unknown"); 

77 } else { 

78 strncpy(req.usernm, pwd->pw_name, USERNM MAX-1); 

79 req.usernm[USERNM MAX-1] = ’\0'; 

80 ) 

[53—59] ”如 果 能 够 连接 到 打印 假 脱 机 守护 进程 , 则 调用 submit file 将 要 打印 的 文件 传送 到 
守护 进程 ,然后 用 返回 值 0 表示 成 功 后 退出 。 如 果 不 能 连接 到 任何 地 址 ， 那 么 就 调用 
err exit 来 打印 错误 消息 并 且 返 回 1 表示 失败 后 退出 (附录 B 包含 了 err_exit 
的 源 代 码 和 其 他 错误 例 程 )。 

[60 一 80] | submit file 发 送 打 印 机 请 求 到 守护 进程 并 读 取 响应 消息 。 首先 , 建立 printreq 
请 求 头 。 使 用 geteuid 来 获得 调用 者 的 有 效用 户 ID 并 将 其 传 给 getpwuid 以 便 查 
找 在 系统 口令 文件 中 的 用 户 。 将 该 用 户 名 复制 到 请 求 头 。 如 果 不 能 识别 用 户 ， 在 请 求 
首部 中 使 用 字符 串 "unknown"。 从 口令 文件 中 复制 用 户 名 时 ， 为 避免 写 超出 请 求 首 
部 的 用 户 名 缓冲 区 ， 可 以 使 用 strncpy。 如 果 用 户 名 比 缓冲 区 长 ，strncpy 不 会 在 
缓冲 区 中 存储 终止 null 字 节 ， 因 此 我 们 需要 自己 来 做 。 

81 req.size = htonl(nbytes); 

82 if (text) 

83 req.flags = htonl(PR_TEXT); 

84 else 

85 req.flags = 0; 

86 if ((len = strlen(fname)) >= JOBNM_MAX) { 

87 /* 

88 * Truncate the filename (4-5 accounts for the leading 

89 * four characters and the terminating null). 

90 *7 

91 strcpy(req.jobnm, "... "); 

92 strncat(req.jobnm, &fname[len-JOBNM_MAX+5], JOBNM MAX-5); 

93 ) else ( 

94 strcpy(req.jobnm, fname); 

95 } 

96 ye 

97 * Send the header to the server. 

98 vf 

99 nw = writen(sockfd, &req, sizeof(struct printreq)); 

100 if (nw != sizeof(struct printreq)) { 

101 if (nw < 0) 

102 err sys("can't write to print server"); 

103 else 

104 err quit("short write ($d/$d) to print server", 

105 nw, Sizeof(struct printreq)); 
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[81 一 95] ”将 要 打印 的 文件 转 成 网 络 字 节 序 后 ， 将 其 文件 长 度 保存 在 请 求 首部 。 如 果 文件 按 纯 
文本 格式 打印 ,在 请 求 首部 保存 PR. TEXT 标志 。 通 过 将 这 些 整数 转化 成 网 络 字 节 序 ， 
可 以 在 打印 假 脱 机 守护 进程 在 其 他 计算 机 系统 运行 的 同时 在 客户 端 系统 上 运行 
print fp. MA, 即便 这 些 系统 使 用 不 同 字 节 序 的 处 理 器 , 这 些 命令 仍 可 运行 (在 
16.3.1 节 讨 论 过 字 节 序 )。 
将 作业 名 设 为 要 打印 的 文件 名 。 如 果 作 业 名 的 长 度 超出 了 报 文 所 能 容纳 的 作业 名 字 
段 长 度 ， 那 么 仅 复 制 可 容纳 的 作业 名 的 最 后 部 分 。 这 样 就 有 效 地 将 作业 名 的 开头 部 
分 截 去 ， 并 代入 省 略 符 ， 以 表示 该 字段 还 有 更 多 的 字符 。 

[96 一 106] ”然后 使 用 writen 将 请 求 头发 送 到 守护 进程 〈 回 忆 一 下 我 们 曾 在 图 14-24 中 介绍 过 
的 writen BUD. writen 函数 使 用 多 个 write 调用 来 传输 指定 数量 的 数据 。 如 
果 写 入 失败 或 者 传输 少 于 期 望 的 数据 ， 将 打印 错误 消息 然后 退出 。 

107 s” 

108 * Now send the file. 

109 */ 

110 while ((nr = read(fd, buf, IOBUFSZ)) != 0) { 

111 nw = writen(sockfd, buf, nr); 

112 if (nw != nr) { 

113 if (nw < 0) 

114 err_sys("can’t write to print server"); 

115 else 

116 err_quit ("short write (%d/%d) to print server", 

117 nw, nr); 

118 } 

119 } 

120 )* 

121 * Read the response. 

122 *J 

123 if ((nr » readn(sockfd, &res, sizeof(struct printresp))) !- 

124 sizeof(struct printresp)) 

125 err sys("can't read response from server"); 

126 if (res.retcode != 0) { 

127 printf ("rejected: %s\n", res.msg); 

128 exit (1); 

129 } else { 

130 printf ("job ID $ld\n", (long) ntohl (res. jobid) ); 

Los } 

132 } 

[107~119] ”将 首部 发 送 到 守护 进程 后 ， 发 送 要 打印 的 文件 。 同 时 读 取 文件 的 TOBUFSz 字 节 并 用 
writen 发 送 数据 到 守护 进程 。 如 果 写 失败 或 者 写 少 了 ， 那么 就 打印 错误 信息 并 退出 。 

[120—132] ”把 要 打印 的 文件 发 送 给 守护 进程 后 ， 读 取 守 护 进程 的 响应 数据 。 如 果 请 求 失 败 ， 返 


回 码 (retcode) 为 非 零 值 ， 并 且 将 响应 中 的 本 文 形式 的 错误 信息 打印 出 来 。 如 
果 请 求 成 功 ， 将 打印 作业 ID， 用 户 此 后 可 以 使 用 此 ID 引用 该 请 求 。( 我 们 将 写 一 
个 命令 取消 一 个 挂 起 的 打印 请 求 留 作 练习 ; 作业 ID 可 以 用 于 取消 作业 请 求 ， 其 作 
用 是 从 打印 队列 中 识别 要 删除 的 作业 ， 参 见习 题 21.5)。 当 submin_file 返回 到 
main 函数 时 ， 退 出 ， 表 明 请 求 成 功 。 

注意 , 一 个 成 功 的 守护 进程 响应 并 不 意味 着 打印 机 可 以 打印 该 文件 , 仅仅 意味 着 守 


658 第 21 章 与 网 络 打印 机 通信 





护 进 程 成 功 地 将 其 加 入 到 打印 作业 队列 。 
现在 print 命令 已 经 完全 了 解 过 了 。 我 们 要 看 的 最 后 一 个 C 源 代码 文件 是 打印 假 脱 机 守护 
进程 。 


/* 

* Print server daemon. 
*f 

#include "apue.h" 
#include «fcntl.h» 
#include «dirent.h» 
#include <ctype.h> 
#include <pwd.h> 
#include <pthread.h> 
#include <strings.h> 
#include <sys/select.h> 
#include <sys/uio.h> 








PRR 
NOrPowWwW OHA DOB WN Pb 


m" 
w 


#include "print.h" 


mn 
A 


#include "ipp.h" 


H 
u 


/* 

* These are for the HTTP response from the printer. 
* 

#define HTTP INFO (x) ((x) >= 100 && (x) <= 199) 
#define HTTP SUCCESS(x) ((x) >= 200 && (x) <= 299) 


Hrer 
(o oo 下 


N 
e 


/* 
* Describes a print job. 
* 
struct job ( 
struct job *next; /* next in list */ 
struct job *prev; /* previous in list */ 
long jobid; /* job ID */ 
struct printreq req; /* copy of print request */ 


NJ) NO F2 FO PKSPK MN MN 
c -209o UU! SF WN 


N 
wo 


/* 

* Describes a thread processing a client request. 

* 

32 struct worker thread { 

33 struct worker thread *next; /* next in list */ 

34 struct worker thread *prev; /* previous in list */ 
35 pthread t tid; /* thread ID */ 

36 int sockfd; /* socket */ 

373 Yz 


0 一 19] ”打印 假 脱 机 守护 进程 包括 前 面 看 到 的 IPP 头 文件 ， 因 为 守护 进程 需要 用 这 个 协议 与 打 
印 机 通信 。HTTP_INFO 和 HTTP_SUCCESS 宏 定 义 了 HTTP 请 求 的 状态 OPP 建立 在 
HTTP Z. E). RFC 2616 第 10 节 定 义 了 HTTP 状态 人 码 。 
[20 一 37] “ 假 脱 机 守护 进程 使 用 job 和 worker thread 结构 来 跟踪 相应 的 打印 作业 和 接受 打 
印 请 求 的 线程 。 
38 /* 


39 * Needed for logging. 
40 */ 


w w 
e oO 





21.5 源 代码 659 


41 int log_to_stderr = 0; 

42 /* 

43 * Printer-related stuff. 

44 +y 

45 struct addrinfo *printer; 

46 char *printer_name; 

47 pthread mutex t configlock = PTHREAD MUTEX INITIALIZER; 

48 int reread; 

49 y% 

50 * Thread-related stuff. 

Sr x7 

52 struct worker thread *workers; 

53 pthread mutex t workerlock = PTHREAD MUTEX INITIALIZER; 

54 sigset t mask; 

B5 J* 

56 * Job-related stuff. 

Sh 4 

58 struct job *jobhead, *jobtail; 

59 int jobfd; 

[38—41] ”日志 函数 需要 定义 log to stderr 变量 ， 并 且 将 其 设 为 0， 将 日 志 消息 发 送 到 系统 
日 志 而 不 是 标准 错误 。 在 print.c 中 ， 即 使 在 用 户 命令 中 不 使 用 日 志 ， 也 定义 
log_to_stderr 并 将 其 设置 为 1。 如 果 将 实用 工具 函数 拆 分 为 两 个 独立 的 文件 : 一 
个 用 于 服务 器 ， 另 一 个 用 于 客户 端 命令 ， 则 可 以 避免 这 种 情况 。 

[42—48] ”使 用 全 局 指针 变量 printer 来 保存 打印 机 的 网 络 地 址 。 在 printer name 中 保存 打 
印 机 的 主机 名 。configlock 用 于 防止 访问 reread 变量 ， 该 变量 用 来 表示 守护 进 
程 需要 再 次 读 取 配 置 文件 ， 原 因 可 能 是 管理 员 改 变 了 打印 机 网 络 地 址 。 

[49—54] ”接着 ,定义 与 线程 相关 的 变量 。 使 用 workers 作为 双向 链表 的 头 部 ， 该 表 用 于 接收 来 自 
客户 端的 文件 。 采 用 workerlock 互 斥 量 来 保护 该 表 .。 变量 mask 用 于 线程 的 信和 号 掩 码 。 

[55—59] ”对 于 挂 起 作业 的 链表 , 定义 jobhead 为 表 头 , jobtail 为 表 尾 。 该 表 也 是 双向 链表 ， 
但 是 需要 将 作业 加 入 到 表 尾 ， 所 以 需要 一 个 指针 来 记 住 表 尾 。 至 于 表 中 工作 者 线程 的 
顺序 是 无 关 紧要 的 。 因 此 可 以 将 它们 加 入 到 表 头 而 不 需要 记 住 尾 指针 。jobfd 是 作业 
文件 的 文件 描述 符 。 

60 int32.t nextjob; 

61 pthread mutex t joblock = PTHREAD MUTEX INITIALIZER; 

62 pthread cond t jobwait = PTHREAD COND INITIALIZER; 

63 j* 

64 * Function prototypes. 

65 wi 

66 void init request(void); 

67 void init printer(void); 

68 void update jobno (void); 

69 int32 t get newjobno (void); 

70 void add job(struct printreq *, int32 t); 

71 void replace job(struct job *); 

72 void remove_job(struct job *); 

73 void build_gonstart (void) ; 
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74 void *client_thread(void *); 

75 void *printer_thread(void *); 

76 void *signal_thread(void *); 

77 ssize t readmore(int, char **, int, int *); 

78 int printer status(int, struct job *); 

79 void add worker(pthread t, int); 

80 void kill workers (void); 

81 void client cleanup(void *); 

82 /* 

83 * Main print server thread. Accepts connect requests from 

84 * clients and spawns additional threads to service requests. 

S5. ^ 

86 * LOCKING: none. 

a". 从 这 

88 int 

89 main(int argc, char *argv[]) 

90 { 

91 pthread_t tid; 

92 struct addrinfo *ailist, *aip; 

93 int sockfd, err, i, n, maxfd; 

94 char *host; 

95 fd set rendezvous, rset; 

96 struct sigaction sa; 

97 struct passwd *pwdp; 

[60—62] | nextjob 是 接收 的 下 一 个 打印 作业 的 ID。 互 斥 量 joblock 保护 作业 表 ， 同 时 还 有 
jobwait 代表 的 条 件 变 量 。 

[63 一 81] — 声明 此 文件 中 所 有 余下 的 函数 的 原型 。 提 前 做 好 这 些 工作 可 以 使 得 在 文件 中 放置 函 
数 时 不 用 担心 函数 调用 的 顺序 。 

[82—97] ”打印 假 脱 机 守护 进程 的 main 函数 执行 两 个 任务 : 初始 化 守护 进程 然后 处 理 来 自 客 
户 端的 连接 请 求 。 

98 if (argc != 1) 

99 err quit("usage: printd"); 

100 daemonize ("printd"); 

101 sigemptyset(&sa.sa mask); 

102 sa.sa flags = 0; 

103 sa.sa handler = SIG IGN; 

104 if (sigaction(SIGPIPE, &sa, NULL) < 0) 

105 log sys("sigaction failed"); 

106 sigemptyset (&mask) ; 

107 sigaddset(&mask, SIGHUP); 

108 sigaddset(&mask, SIGTERM); 

109 if ((err = pthread sigmask(SIG BLOCK, &mask, NULL)) != 0) 

110 log sys("pthread sigmask failed"); 

111 n = sysconf( SC HOST NAME MAX) ; 

112 if (n« 0) /* best guess */ 

113 n = HOST NAME MAX; 

114 if ((host = malloc(n)) == NULL) 

115 log sys("malloc error"); 

116 if (gethostname(host, n) < 0) 

LEZ log_sys("gethostname error"); 
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118 if ((err = getaddrlist(host, "print", &ailist)) != 0) { 

119 log quit("getaddrinfo error: $s", gai strerror(err)); 

120 exit(1); 

121 ) 

[908—100] . 守护 进程 没有 任何 选项 〈 唯 一 的 参数 是 命令 名 自身 )， 所 以 如 果 arge 不 为 1， 调 用 
err quit 打印 错误 信息 然后 退出 。 调 用 图 13-1 所 示 程 序 中 的 daemonize 函数 成 为 
一 个 守护 进程 。 在 此 之 后 ， 不 能 在 标准 错误 上 打印 错误 消息 ， 而 是 对 其 记录 日 志 。 

[101—110] ”忽略 SIGPIPE。 接 下 来 将 要 写 套 接 字 文 件 描 述 符 ， 并 且 不 想 让 写 错误 触发 
SIGPIPE, 因为 其 默认 动作 是 杀 死 进程 .下 一 步 , 设置 线程 信号 掩 码 , 包括 SIGHUP 
和 sSIGTERM。 创 建 的 所 有 进程 均 继 承 这 个 信号 掩 码 。 使 用 SIGHUP 信号 告诉 守 
护 进程 再 次 读 取 配置 文件 ，SIGTERM 信号 告诉 守护 进程 执行 清理 工作 并 优雅 地 
退出 。 

[111~117] WH sysconf 来 获取 主机 名 的 最 大 长 度 。 如 果 sysconf 失败 或 者 没有 定义 该 限 
制 ， 采 用 HOST_NAME MAX 作为 最 佳 选择 。 有 时 ， 平 台 已 经 定义 了 此 常量 ， 但 如 
果 没 有 定义 ， 则 在 Print .h 中 选择 属于 自己 的 值 。 分 配 内 存 来 保存 主机 名 并 调用 
gethostname 来 获取 。 

[118 一 121] ” 接 下 来 ， 尝 试 找到 用 于 守护 进程 提供 打印 假 脱 机 服务 的 网 络 地 址 。 

122 FD ZERO(&rendezvous); 

123 maxfd - -1; 

124 for (aip = ailist; aip != NULL; aip = aip-»ai next) { 

125 if ((sockfd = initserver(SOCK STREAM, aip->ai_addr, 

126 aip-»ai addrlen, QLEN)) >= 0) { 

127 FD_SET(sockfd, &rendezvous) ; 

128 if (sockfd > maxfd) 

129 maxfd = sockfd; 

130 } 

i31 ) 

132 if (maxfd -- -1) 

133 log quit("service not enabled"); 

134 pwdp = getpwnam(LPNAME); 

135 if (pwdp == NULL) 

136 log sys("can't find user $s", LPNAME); 

137 if (pwdp-»pw uid == 0) 

138 log quit("user $s is privileged", LPNAME); 

139 if (setgid(pwdp->pw_gid) < 0 || setuid(pwdp-»pw uid) < 0) 

140 log sys("can't change IDs to user $s", LPNAME); 

141 init request(); 

142 init printer(); 

[122—131] WẸ rendezvous 变量 ,该 变量 将 与 select 一 起 用 来 等 待 客户 端 连接 请 求 。 将 


[132—133] 


最 大 文件 描述 符 初始 化 为 -1， 以 确保 所 分 配 的 第 一 个 文件 描述 符 会 大 于 maxfd。 
对 于 每 个 需要 提供 服务 的 网 络 地 址 ， 调 用 initserver( 见 图 16-22) 来 分 配 和 初 
始 化 一 个 套 接 字 。 如 果 initserver 成 功 ， 将 其 文件 描述 符 加 入 £d set; WR 
该 描述 符 大 于 现 有 最 大 值 maxfd， 将 maxfd 设 为 该 描述 符 值 。 

走 完整 个 addrinfo 结构 列表 后 ,如 果 maxfd 仍 为 -1, 不 能 启动 打印 假 脱 机 服务 ， 
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记录 日 志 然 后 退出 。 

[0134 一 140] ”守护 进程 需要 超级 用 户 特权 来 绑 定 一 个 套 接 字 到 保留 端口 。 完 成 绑 定 后 ， 通 过 将 用 户 
ID 改变 为 lp 的 用 户 ID CBZ 21.4 节 的 安全 方面 的 讨论 ) 降低 该 程序 特权 。 这 里 想 
遵循 最 小 特权 原则 ， 以 避免 在 守护 进程 中 将 系统 暴露 给 任何 可 能 的 攻击 。 调 用 
getpwnam 来 找到 与 用 户 lp 相关 的 口令 条 目 。 如 果 没 有 此 用 户 ， 或 者 lp 具有 超级 
用 户 特权 ， 记 录 日 志 然 后 退出 。 否则 ,调用 setuid 将 实际 用 户 ID 和 有 效用 户 ID 改 
为 1p AP ID. 为 了 避免 暴露 系统 ， 如 果 不 能 减少 特权 , 那么 就 选择 不 提供 任何 服务 。 

[141—142] ”调用 init request 来 初始 化 作业 请 求 并 确保 只 有 一 个 守护 进程 副本 正在 运行 。 
调用 init printer 初始 化 打印 机 信息 〈 稍 后 就 可 以 看 到 这 两 个 函数 )。 

143 err = pthread_create(&tid, NULL, printer_thread, NULL); 

144 if (err == 0) 

145 err = pthread_create(&tid, NULL, signal_thread, NULL); 

146 if (err != 0) 

147 log exit(err, "can't create thread"); 

148 build qonstart(); 

149 log msg("daemon initialized"); 

50 for (77) { 

151 rset = rendezvous; 

152 if (select (maxfd+l, &rset, NULL, NULL, NULL) < 0) 

153 log sys("select failed"); 

154 for (i = 0; i <= maxfd; i++) { 

155 if (FD ISSET(i, &rset)) { 

56 {* 

157 * Accept the connection and handle the request. 

158 */ 

159 if ((sockfd = accept(i, NULL, NULL)) < 0) 

160 log ret("accept failed"); 

161 pthread create(&tid, NULL, client thread, 

162 (void *)((long)sockfd)); 

163 } 

164 } 

165 } 

166 exit (1); 

167 } 

[143—149] ”创建 一 个 处 理 信号 的 线程 和 一 个 与 打印 机 通信 的 线程 。( 通 过 限制 打印 机 只 与 一 个 
线程 通信 ， 可 以 简化 与 打印 机 相关 的 数据 结构 的 锁定 。) 然后 调用 
build qonstart fE/var/spool/printer 目录 中 搜索 任何 挂 起 的 作业 。 对 于 
找到 的 每 个 作业 ， 将 建立 一 个 结构 ， 让 打印 机 线程 将 该 作业 的 文件 送 到 打印 机 。 至 
Jt, 完成 守护 进程 的 设置 , 因此 记录 一 条 日 志 消息 , 表明 守护 进程 初始 化 成 功 完成 。 

[150~167] “将 rendezvous fd set 结构 复制 到 rset， 然后 调用 select 等 待 其 中 的 一 个 文件 


描述 符 变 为 可 读 。 必 须 复制 rendezvous， 因 为 select 会 修改 传 入 的 fd_set 结构 
来 包含 满足 事件 的 文件 描述 符 。 既 然 服务 器 已 经 将 套 接 字 初始 化 完毕 ， 一 个 可 读 的 文 
件 描述 符 就 意味 着 一 个 连接 请 求 需要 处 理 。 当 select 返回 时 ， 检 查 rset 来 获取 一 
个 可 读 的 文件 描述 符 。 如 果 找 到 一 个 ， 调 用 accept 接受 该 请 求 。 如 果 失 败 ， 记 录 日 
志 然 后 继续 检查 更 多 的 可 读 文件 描述 符 。 和 否则 ， 创 建 一 个 线程 来 处 理 客 户 端 请 求 。 主 


21.5 源 代码 663 





168 
169 
170 
171 
172 
173 
174 
175 
176 
177 
178 


179 
180 
181 
182 
183 
184 
185 
186 
187 
188 
189 
190 
191 
192 


[168—182] 


[183—192] 


193 
194 
195 
196 
197 
198 
199 
200 
201 
202 
203 
204 


/* 











线程 main 一 直 循环 ， 将 请 求 发 送 到 其 他 线程 处 理 ， 永 远 不 应 到 达 exit 语句 。 


* Initialize the job ID file. Use a record lock to prevent 


more than one printer daemon from running at a time. 


* LOCKING: none, except for record-lock on job ID file. 


Ey 


void 


init request (void) 


( 


int 


char 


n; 
name [FILENMSZ]; 


sprintf(name, "%s/%s", SPOOLDIR, JOBFILE); 
jobfd = open(name, O CREAT|O RDWR, S IRUSR|S IWUSR) ; 
if (write lock(jobfd, 0, SEEK SET, 0) < 0) 


/* 


log quit("daemon already running"); 


* Reuse the name buffer for the job counter. 


ird 


if ((n = read(jobfd, name, FILENMSZ)) < 0) 


log sys("can't read job file"); 


if (n == 0) 


} 


nextjob = 1; 
else 


nextjob = atol (name) ; 


函数 init request 做 两 件 事 : 在 作业 文件 /var/spool/printer/jobno 上 放 一 
个 记录 锁 , 然后 读 该 文件 并 确定 下 一 个 要 赋值 的 作业 编号 。 在 整个 文件 上 放置 一 把 写 锁 ， 
表明 守护 进程 正在 运行 。 如 果 当 前 已 有 一 个 守护 进程 正在 运行 ， 想 启动 另外 一 个 打印 假 
脱 机 守护 进程 副本 ， 该 程序 将 无 法 获得 写 锁 ， 然 后 就 退出 。 因 此 ， 同 时 只 能 有 一 个 守护 
进程 在 运行 。( 图 13-6 中 使 用 过 这 种 技术 ， 在 14.3 节 中 讨论 过 write lock 宏 。) 
作业 文件 包含 一 个 ASCII 码 的 整数 字符 串 来 表示 下 一 个 作业 编号 。 如 果 文 件 刚 创建 
并 且 为 空 ， 那 么 将 nextjob RHA 1. BW, 4H atol 将 字符 串 转换 为 整数 并 
将 其 作为 下 一 个 作业 编号 。 让 jobfq 对 于 作业 文件 保持 打开 状态 ， 因 此 当 作 业 创 
建 时 能 够 更 新 作业 编号 。 不 能 关闭 该 文件 ， 因 为 这 将 释放 已 经 放置 在 上 面 的 写 锁 。 
在 一 个 长 整 型 数 长 度 为 64 位 的 系统 上 ,至 少 需要 一 个 21 字 节 的 缓冲 区 来 存放 代表 最 大 长 
整 型 数 的 字符 串 。 这 里 重用 文件 名 缓冲 区 ， 因 为 在 print.h "P FILENMSZ 定义 为 64。 





/* 





* Initialize printer information from configuration file. 


* 


* LOCKING: none. 


mf 


void 


init printer (void) 


{ 


printer = get_printaddr(); 
if (printer == NULL) 


exit(1); /* message already logged */ 


printer name = printer-»ai canonname; 


818 


664 


205 
206 
207 
208 


209 
210 
211 
212 
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214 
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219 
220 
221 
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} 


/* 
* 
* 
* 


* 


if (printer_name == NULL) 
printer_name = "printer"; 
log_msg("printer is $s", printer name); 


Update the job ID file with the next job number. 
Doesn't handle wrap-around of job number. 


LOCKING: none. 


Ky 
void 
update jobno (void) 


{ 


char buf[32]; 


if (lseek(jobfd, 0, SEEK SET) == -1) 
log sys("can't seek in job file"); 


sprintf (buf, "$d", nextjob); 
if (write(jobfd, buf, strlen(buf)) < 0) 


) 


log sys("can't update job file"); 


[193—208] init printer 用 于 设置 打印 机 名 和 地 址 。 调 用 get printaddr CK util.c) 


获得 打印 机 地 址 。 如 果 失 败 ， 记 录 日 志 并 退出 。 当 找 不 到 打印 机 地 址 时 ， 
get printaddr 会 记录 自己 的 错误 信息 日 志 。 如 果 打 印 机 地 址 未 找到 ， 将 
addrinfo 中 的 ai_canonname 设 为 打印 机 名 。 如 果 该 字段 为 空 ， 将 打印 机 名 设 
为 默认 值 。 注 意 ， 将 正在 使 用 的 打印 机 名 也 记录 在 日 志 中 ， 以 帮助 管理 员 能 够 诊断 
假 脱 机 系统 的 问题 。 


[209—224] update jobno 函数 用 于 在 作业 文件 /var/spool/printer/jobno 中 写 入 下 一 


个 作业 编号 。 首 先 ， 找 到 文件 开头 。 然 后 ， 将 整数 作业 编号 转换 为 一 个 字符 串 并 写 
入 文件 。 如 果 写 入 失败 ， 记 录 日 志 并 退出 。 作 业 编 号 自动 递增 。 如 何 处 理 回 绕 的 作 
业 编 号 留 作 一 个 练习 (见习 题 21.9)。 





* Get the next job number. 

* 

* LOCKING: acquires and releases joblock. 
Ey 

int32. t 


get_newjobno (void) 


{ 


/* 


* 


int32 t jobid; 


pthread mutex lock(&joblock); 
jobid = nextjob++; 
if (nextjob <= 0) 

nextjob = 1; 
pthread mutex unlock(&joblock); 
return(jobid); 


Add a new job to the list of pending jobs. Then signal 
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243  * the printer thread that a job is pending. 

244  * 

245  * LOCKING: acquires and releases joblock. 

246  */ 

247 void 

248 add job(struct printreq *reqp, int32 t jobid) 

249 { 

250 struct job *jp; 

251 if ((jp » malloc(sizeof(struct job))) -- NULL) 

252 log sys("malloc failed"); 

253 memcpy(&jp-»req, reqp, sizeof(struct printreq)); 

[225—240] get newjobno 函数 用 于 获得 下 一 个 作业 编号 。 首 先 将 joblock 互 斥 量 锁 住 。 递 
增 nextjob 变量 , 并 处 理 回 绕 的 情况 。 然 后 解锁 互 斥 量 并 返回 递增 前 的 nextjob 
值 。 多 个 线程 可 以 同时 调用 get_newjobno; 需要 串 行 化 访问 下 一 个 作业 编号 ， 
因此 每 个 线程 得 到 一 个 唯一 的 作业 编号 。( 见 图 11-9， 考 察 在 这 种 情况 下 ， 如 果 不 
串 行 化 线程 会 发 生 什么 情况 。) 

[241 一 253] add job 函数 用 于 在 挂 起 的 打印 作业 列表 中 增加 一 个 新 的 作业 请 求 。 首 先 为 job 
结构 分 配 空间 。 如 果 失 败 ， 记 录 日 志 并 退出 。 此 时 ， 打 印 请 求 已 经 安全 地 存储 在 磁 
盘 上 ; 当 打 印 假 脱 机 守护 进程 重启 时 ,会 重新 读 取 这 些 请 求 。 当 为 新 作业 分 配 完 空 
li], 将 客户 端的 请 求 结构 复制 到 作业 结构 。 在 print.h 中 一 个 job 结构 包含 一 对 
列表 指针 ， 一 个 作业 ID 和 一 个 从 客户 端 print 命令 发 送 过 来 的 printreq 结构 
副本 。 

254 jp->jobid = jobid; 

255 jp->next = NULL; 

256 pthread_mutex_lock (&joblock) ; 

257 jp->prev = jobtail; 

258 if (jobtail == NULL) 

259 jobhead = jp; 

260 else 

261 jobtail->next = jp; 

262 jobtail = jp; 

263 pthread mutex unlock(&joblock); 

264 pthread cond signal(&jobwait); 

265 ) 

266 /* 

267 * Replace a job back on the head of the list. 

268 * 

269  * LOCKING: acquires and releases joblock. 

270  */ 

271 void 

272 replace job(struct job *jp) 

243. 1 

274 pthread mutex lock(&joblock); 

215 jp->prev = NULL; 

276 jp->next = jobhead; 

277 if (jobhead == NULL) 

278 jobtail = jp; 

279 else 

280 jobhead->prev = jp; 
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281 
282 
283 


jobhead = jp; 
pthread mutex unlock(&joblock); 
) 





[254—265] 保存 作业 ID 并 锁 住 joblock 互 斥 量 以 获得 对 打印 作业 链表 的 独占 访问 。 将 在 该 链 


表 尾 增加 新 的 作业 结构 。 将 新 的 作业 结构 的 前 项 指针 〈previous pointer) 指向 链表 
中 最 后 一 个 作业 。 如 果 链 表 为 空 ， 将 jobhead 指向 新 的 结构 。 否 则 ， 将 链表 中 最 
后 一 项 的 后 项 指针 (next pointer) 指向 新 的 结构 。 然 后 设置 jobtail 指向 新 的 结 
构 。 对 互 斥 量 解锁 ， 然 后 给 打印 机 线程 发 信号 ， 告 诉 该 线程 另 一 个 作业 可 用 了 。 


[266—283] 函数 replace job 用 于 将 作业 插入 到 挂 起 作业 队列 头 部 。 需 要 获得 joblock H. 


284 
285 
286 
287 
288 
289 
290 
291 
292 
293 
294 
295 
296 
297 
298 
299 
300 


301 
302 
303 
304 
305 
306 
307 
308 
309 
310 
311 
312 
313 
314 


3158 
316 
317 


FE, job 结构 中 的 前 项 指针 设 为 NULL， 将 后 项 指针 指向 表 头 。 如 果 表 为 空 ， 
将 jobtail 指向 插入 的 job 结构 。 和 否则 ， 将 表 中 第 一 个 作业 结构 的 前 项 指针 指向 
插入 的 job 结构 。 然 后 将 jobhead 指向 插入 的 job 结构 ， 成 为 新 的 表 头 。 最 后 ， 
释放 joblock HE. 
/* 
* Remove a job from the list of pending jobs. 
* 
* LOCKING: caller must hold joblock. 
Eg 
void 
remove_job (struct job *target) 
{ 
if (target->next != NULL) 
target->next->prev = target->prev; 
else 
jobtail = target->prev; 
if (target->prev != NULL) 
target->prev->next = target->next; 
else 
jobhead = target->next; 


} 


/* 

* Check the spool directory for pending jobs on start-up. 
* 

* LOCKING: none. 

27 

void 

build_qonstart (void) 

{ 


int fd, err, nr; 

int32 t jobid; 

DIR *dirp; 

struct dirent *entp; 

struct printreq req; 

char dname[FILENMSZ], fname[FILENMSZ]; 


sprintf(dname, "%s/%s", SPOOLDIR, REQDIR); 
if ((dirp = opendir(dname)) -- NULL) 
return; 





[284—300] remove job 将 给 定 的 作业 从 挂 起 的 作业 列表 中 删除 。 调 用 者 必须 已 经 持 有 
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joblock 互 斥 量 。 如 果 后 项 指针 不 为 空 ， 将 下 一 个 条 目的 前 项 指针 指向 被 删除 目 
标的 前 项 指针 所 指向 的 条 目 。 和 否则 ， 该 条 目 为 列表 中 最 后 一 个 ， 因 此 将 jobtail 
指向 被 删除 目标 的 前 项 指针 所 指向 的 条 目 。 如 果 被 删除 目标 的 前 项 指针 不 为 室 ， 将 
前 一 个 条 目的 后 项 指针 指向 被 删除 目标 的 后 项 指针 所 指向 的 条 目 。 否则 ， 这 个 是 表 
中 第 一 个 条 目 ， 因 此 将 jobhead 指向 被 删除 目标 后 面 的 那个 条 目 。 

[301—317] “ 当 和 守护 进程 启动 时 ， 调 用 build_qonstart 从 存储 在 /var/spool/printer/reqs 
中 的 磁盘 文件 建立 一 个 内 存 中 的 打印 作业 列表 。 如 果 不 能 打开 该 目录 ， 表 示 没 有 打 


印 作业 要 处 理 ， 因 此 就 返回 。 822 
318 while ((entp = readdir(dirp)) != NULL) { 
319 /* 
320 * Skip's” ang ".," 
321 s7 
322 if (strcmp(entp-»d name, ".") == 0 || 
323 strcmp(entp-»d name, "..") == 0) 
324 continue; 
325 /* 
326 * Read the request structure. 
327 x 
328 sprintf (fname, "$s/$s/$s", SPOOLDIR, REQDIR, entp-»d name); 
329 if ((fd = open(fname, O RDONLY)) < 0) 
330 continue; 
331 nr = read(fd, &req, sizeof(struct printreq)); 
332 if (nr != sizeof(struct printreq)) { 
333 if (nr « 0) 
334 err - errno; 
335 else 
336 err - EIO; 
337 close(fd); 
338 log msg("build qonstart: can't read $s: %s", 
339 fname, strerror(err)); 
340 unlink(fname); 
341 sprintf(fname, "%s/%s/%s", SPOOLDIR, DATADIR, 
342 entp-»d name); 
343 unlink(fname); 
344 continue; 
345 } 
346 jobid = atol(entp-»d name); 
347 log_msg("adding job %d to queue", jobid); 
348 add_job(&req, jobid); 
349 } 
350 closedir(dirp) ; 
351 } 


[318—324] ”在 目录 中 一 次 读 取 一 个 条 目 ， 忽 略 . 和 . .。 

[325 一 345] ”对 于 每 个 条 目 ， 创 建 一 个 文件 完全 路 径 名 并 只 读 打开 。 如 果 open 调用 失败 ， 跳 过 
该 文件 。 否 则 ， 将 读 取 保存 在 文件 中 的 printreg 结构 。 如 果 不 能 读 取 整 个 结构 ， 
关闭 该 文件 ， 记 录 日 志 并 unlink 该 文件 。 然 后 建立 相应 数据 文件 的 完全 路 径 名 ， 
再 unlink 该 文件 。 

[346—351] ”如 果 能 够 读 取 一 个 完整 的 printreq 结构 ， 将 文件 名 转换 为 作业 ID (文件 名 就 是 


[823] 
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其 作业 ID), 记录 日 志 , 然后 将 请 求 加 入 到 挂 起 的 打印 作业 列表 。 当 读 完整 个 目录 ， 
readdir 返回 NULL， 关 闭 目 录 然 后 返回 。 

352 js 

353 * Accept a print job from a client. 

354 * 

355 * LOCKING: none. 

356 r4 

351 void * 

358 client thread(void *arg) 

359 { 

360 int n, fd, sockfd, nr, nw, first; 

361 int32 t jobid; 

362 pthread t tid; 

363 struct printreq req; 

364 struct printresp res; 

365 char name [FILENMSZ]; 

366 char buf [IOBUFS2]; 

367 tid = pthread self(); 

368 pthread_cleanup_push(client_cleanup, (void *) ((long)tid)); 

369 sockfd = (long)arg; 

370 add_worker (tid, sockfd); 

371. i* 

372 * Read the request header. 

373 ep 

374 if ((n = treadn(sockfd, &req, sizeof(struct printreq), 10)) != 

ATA sizeof(struct printreq)) { 

376 res.jobid = 0; 

371 if (n « 0) 

378 res.retcode - htonl(errno); 

379 else 

380 res.retcode - htonl(EIO); 

381 strncpy(res.msg, strerror(res.retcode), MSGLEN MAX); 

382 writen(sockfd, &res, sizeof(struct printresp)); 

383 pthread exit((void *)1); 

384 } 

[352~370] ” 当 连 接 请 求 被 接受 时 ，main 中 派生 出 client_thread。 其 作用 是 从 客户 端 Print 





命令 中 接收 要 打印 的 文件 。 为 每 个 客户 端 打印 请 求 分 别 创建 一 个 独立 的 线程 。 


首先 是 安装 线程 清理 处 理 程序 ( 见 11.5 节 中 线程 清理 处 理 程序 的 讨论 )。 清理 处 理 程序 是 
client cleanup, 将 在 后 面 用 到 。 它 仅 带 一 个 参数 : 线程 DD。 然后 调用 add worker 
来 创建 一 个 worker_thread 结构 并 将 其 加 入 到 活跃 的 客户 端 线程 列表 中 。 


[371—384] ”此 时 ， 完 成 了 线程 的 初始 化 任务 ， 因 此 从 客户 端 读 取 请 求 头 。 如 果 客 户 端 发 送 的 数 


据 少 于 期 望 或 遇 到 错误 ， 则 响应 一 个 消息 ， 该 消息 指出 错误 的 原因 ， 然 后 调用 


pthread_exit 结束 线程 。 





385 
386 


387 
388 
389 


req.size = ntohl(req.size); 
req.flags = ntohl(req.flags); 


/* 
* Create the data file. 
xf 
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390 jobid = get_newjobno(); 

391 sprintf (name, "%s/%s/%ld", SPOOLDIR, DATADIR, jobid); 
392 fd = creat(name, FILEPERM); 

393 if «fd «4 0) 4 

394 res.jobid - 0; 

395 res.retcode - htonl(errno); 

396 log msg("client thread: can't create $s: $s", name, 
397 strerror(res.retcode)); 

398 strncpy(res.msg, strerror(res.retcode), MSGLEN MAX); 
399 writen(sockfd, &res, sizeof(struct printresp)); 
400 pthread exit((void *)1); 

401 ) 

402 /* 

403 * Read the file and store it in the spool directory. 
404 * Try to figure out if the file is a PostScript file 
405 * or a plain text file. 

406 Ey 

407 first = lg; 

408 while ((nr = tread(sockfd, buf, IOBUFSZ, 20)) > 0) ( 
409 if (first) 4 

410 first 三 0; 

411 if (strncmp(buf, "%!PS", 4) != 0) 

412 req.flags |= PR TEXT; 

413 ) 


[385—401] ”将 请 求 头 中 的 整数 字段 转换 成 主机 字 节 序 ， 调 用 get newjobno 来 保存 这 个 打印 
请 求 的 下 一 个 作业 编号 。 建 立 作 业 数 据 文件 , M /var/spool/printer/data/ 
jobid, jobid 是 请 求 的 作业 ID 。 采 用 权限 许可 来 防止 其 他 人 读 取 这 些 文件 (print.h 
中 定义 FILEPERM 为 S_IRUSR|S_IWUSR)。 如 果 不 能 创建 该 文件 , 记录 错误 日 志 ， 
发 送 失 败 响 应 给 客户 端 ， 调 用 pthread_exit 结束 线程 。 

[402 一 413] ” 读 取 来 自 客户 端的 文件 内 容 ， 要 将 其 写 入 数据 文件 的 私有 副本 中 。 但 是 在 写 任何 东西 之 
BU. 需要 在 第 一 次 循环 时 检查 一 下 是 否 是 PostScript 文件 。 如果 该 文件 不 是 以 s!PS 模式 
开头 ， 可 以 假定 为 其 为 纯 文 本 文件 ， 这 种 情况 下 在 请 求 头 中 设置 PR_TEXT 标志 。( 如 果 
E print 命令 中 有 -t 标志 ， 那 么 客户 端 也 会 设置 此 标志 。) 尽管 PostScript 程序 不 要 求 


以 模式 $! PS 开始 ， 但 文档 格式 指南 (Adobe Systems [1999]) 强烈 推荐 这 种 方式 。 825 
414 nw = write(fd, buf, nr); 
415 if (nw != nr) { 
416 res.jobid = 0; 
417 if (nw < 0) 
418 res.retcode = htonl (errno); 
419 else 
420 res.retcode = htonl(EIO); 
421 log msg("client thread: can't write %s: %s", name, 
422 strerror(res.retcode)); 
423 close(fd); 
424 strncpy(res.msg, strerror(res.retcode), MSGLEN MAX); 
425 writen(sockfd, &res, sizeof(struct printresp)); 
426 unlink (name); 
427 pthread exit((void *)1); 
428 } 
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430 


431 
432 
433 
434 
435 
436 
437 
438 
439 
440 
441 
442 
443 
444 
445 
446 
447 
448 





close (fd); 


/* 

* Create the control file. Then write the 

* print request information to the control 

* fils. 

Ey 

sprintf (name, "%s/%s/%d", SPOOLDIR, REQDIR, jobid); 

fd = creat(name, FILEPERM) ; 

LE (fd <0) 1 
res.jobid = 0; 
res.retcode = htonl(errno); 
log msg("client thread: can't create %s: $s", name, 

strerror(res.retcode)); 

strncpy(res.msg, strerror(res.retcode), MSGLEN MAX); 
writen(sockfd, &res, sizeof(struct printresp)); 
sprintf(name, "%s/%s/%d", SPOOLDIR, DATADIR, jobid); 
unlink (name); 
pthread exit((void *)1); 

) 


[414—430] ”将 来 自 客户 端的 数据 写 入 到 数据 文件 。 如 果 write 失败 ， 记 录 错 误 日 志 ， 关 闭 数据 


文件 的 文件 描述 符 ， 发 送出 错 消息 给 客户 端 ， 删 除数 据 文件 ， 调 用 pthread_exit 
退出 。 注 意 ， 不 需要 显 式 关闭 套 接 字 文件 描述 符 。 当 调用 pthread_exit 时 ， 线 程 
清理 处 理 程序 会 处 理 这 些 事 情 。 

当 接 收 到 所 有 要 打印 的 数据 ， 关 闭 数据 文件 的 文件 描述 符 。 


[431 一 448] FX, 创建 文件 /var/spool/printer/reqs/jobid 以 记 住 打印 请 求 。 如 果 失 


449 
450 
451 
452 
453 
454 
455 
456 
457 
458 
459 
460 
461 
462 
463 
464 
465 
466 


467 
468 
469 
470 
471 
472 


败 ， 记 录 错 误 日 志 ， 发 送出 错 响应 给 客户 端 ， 删 除数 据 文件 ， 终 止 线程 。 


nw = write(fd, &req, sizeof(struct printreq)); 
if (nw != sizeof(struct printreq)) { 
res.jobid = 0; 
if (nw < 0) 
res.retcode = htonl (errno); 
else 
res.retcode = htonl(EIO); 
log_msg("client_thread: can’t write %s: %s", name, 
strerror(res.retcode)); 
close(fd); 
strncpy(res.msg, strerror(res.retcode), MSGLEN MAX); 
writen(sockfd, &res, sizeof(struct printresp)); 
unlink (name); 
sprintf (name, "%s/%s/%d", SPOOLDIR, DATADIR, jobid); 
unlink (name); 
pthread exit((void *)1); 
) 
close(fd); 


/* 

* Send response to client. 

uA 

res.retcode = 0; 

res.jobid = htonl(jobid); 
sprintf(res.msg, "request ID $d", jobid); 


473 


474 
475 
476 
477 
478 
479 
480 
481 


[449—465] ”将 printreq 结构 写 入 控制 文件 。 如 果 出 错 ， 则 记录 日 志 , 关闭 控制 文件 描述 符 ， 


} 
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writen(sockfd, &res, sizeof (struct printresp)); 


/* 

* Notify the printer thread, clean up, and exit. 
2f 

log_msg ("adding job %d to queue", jobid); 
add_job(&req, jobid); 

pthread cleanup pop(1); 

return((void *)0); 


发 送 失败 响应 给 客户 端 ， 删 除数 据 和 控制 文件 ， 终 止 线程 。 


[466~473] ”关闭 控制 文件 的 文件 描述 符 ， 并 发 送 消 息 给 客户 端 ， 该 消息 包括 作业 ID 和 成 功 状 


A (retcode 设 为 0)。 


[474—481] HH add _ job 将 接收 的 文件 加 入 到 挂 起 作业 列表 中 , HAY pthread_cleanup_pop 


482 
483 
484 
485 
486 
487 
488 
489 
490 


491 
492 
493 
494 
495 
496 
497 
498 
599 
500 
501 
502 
503 
504 
505 


506 
507 
508 
509 
510 
Sid 


完成 清理 过 程 。 当 返回 时 线程 终止。 
注意 ， 线 程 退 出 之 前 ， 必 须 关 闭 不 再 使 用 的 任何 文件 描述 符 。 与 线程 终止 不 同 ， 
当 一 个 线程 退出 并 且 进程 中 仍 有 其 他 线程 时 ， 文 件 描述 符 不 会 自动 关闭 。 如 果 不 
关闭 不 需要 的 文件 描述 符 ， 终 将 耗 尽 资源 。 

/* 

* Add a worker to the list of worker threads. 

* LOCKING: acquires and releases workerlock. 

+y 

void 

add_worker (pthread_t tid, int sockfd) 

{ 


struct worker_thread *wtp; 


if ((wtp = malloc (sizeof (struct worker_thread))) == NULL) { 
log_ret ("add_worker: can't malloc"); 
pthread exit((void *)1); 

} 

wtp->tid = tid; 

wtp->sockfd = sockfd; 

pthread mutex lock(&workerlock); 

wtp->prev = NULL; 

wtp->next = workers; 

if (workers != NULL) 
workers ->prev = wtp; 


workers = wtp; 
pthread_mutex_unlock (&workerlock) ; 


) 


/* 
* Cancel (kill) all outstanding workers. 
* 


* LOCKING: acquires and releases workerlock. 
fe 
void 


[827 | 
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512 
913 
514 


515 
516 
517 
518 
519 
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kill_workers (void) 
{ 


struct worker thread *wtp; 


pthread mutex lock(&workerlock); 

for (wtp = workers; wtp !- NULL; wtp = wtp-»next) 
pthread cancel (wtp->tid); 

pthread mutex unlock(&workerlock); 


} 


[482—505] add worker 将 一 个 worker thread 结构 加 入 活动 线程 列表 中 。 分 配 该 结构 需 


要 的 内 存 ， 初 始 化 它 ， 锁 住 workerlock 互 斥 量 ， 将 结构 加 入 到 列表 的 头 部 ， 然 
后 解锁 互 斥 量 。 


[506—519] kill workers 函数 遍历 工作 者 线程 列表 ,然后 一 一 删除 。 遍 历 列表 时 持 有 
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530 
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535 
536 
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539 
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541 
542 
543 
544 
545 
546 
547 
548 


workerlock 互 斥 量 。 注 意 ，pthread_cancel 仅仅 将 线程 列 入 删除 计划 ， 实 际 
的 删除 动作 在 每 个 线程 到 达 下 一 个 删除 点 时 发 生 。 
/* 
* Cancellation routine for the worker thread. 
* LOCKING: acquires and releases workerlock. 
*/ 
void 
client cleanup(void *arg) 
{ 
struct worker thread *wtp; 
pthread_t tid; 


tid = (pthread t) ( (long) arg); 
pthread mutex lock(&workerlock); 
for (wtp = workers; wtp != NULL; wtp = wtp->next) { 
if (wtp->tid == tid) { 
if (wtp->next != NULL) 
wtp->next->prev = wtp->prev; 
if (wtp->prev != NULL) 
wtp-»prev-»next = wtp->next; 
else 
workers = wtp->next; 
break; 
} 
} 
pthread mutex unlock(&workerlock); 
if (wtp != NULL) { 
close (wtp->sockfd) ; 
free (wtp); 


} 


[520~542] MM client_cleanup 是 与 客户 端 命令 通信 的 工作 者 线程 的 线程 清理 程序 。 当 线 


程 调用 pthread_exit 时 ， 或 者 用 一 个 非 0 参数 调用 pthread_cleanup_pop, 
或 者 响应 一 个 删除 请 求 时 ，client_cleanup 函数 会 被 调用 。 其 参数 是 终止 线程 
的 线程 ID。 

锁 住 workerlock 互 斥 量 然后 搜索 工作 者 线程 列表 , 直到 找到 一 个 匹配 的 线程 ID。 


21.5 源 代码 673 


当 找 到 一 个 匹配 时 ， 从 列表 中 删除 工作 者 线程 结构 并 且 停 止 搜索 。 

[543—548] 解锁 workerlock 互 斥 量 ， 关 闭 线程 用 于 和 客户 端 通信 的 套 接 字 文 件 描述 符 ， 然 
后 释放 worker thread 结构 的 内 存 。 
既然 要 获得 workerlock 互 斥 量 ,， 当 kill workers 函数 正在 遍历 列表 时 ， 如 果 
一 个 线程 到 达 一 个 删除 点 时 ， 必 须 等 待 直到 k111 workers 释放 互 斥 量 时 才 可 以 


继续 处 理 。 829 
549 fe 
550 * Deal with signals. 
551 * 
552 * LOCKING: acquires and releases configlock. 
553 Ez 


554 void * 
555 signal_thread (void *arg) 


556 { 

557 int err, signo; 

558 for (Pe) 1 

559 err = sigwait(&mask, &signo); 

560 if (err != 0) 

561 log quit("sigwait failed: $s", strerror(err)); 
562 switch (signo) { 

563 case SIGHUP: 

564 Fi 

565 * Schedule to re-read the configuration file. 
566 */ 

567 pthread mutex lock(&configlock); 

568 reread = 1; 

569 pthread mutex unlock(&configlock); 

570 break; 

571 case SIGTERM: 

572 kill workers(); 

573 log msg("terminate with signal $s", strsignal(signo)); 
574 exit(0); 

575 default: 

576 kill workers(); 

577 log_quit ("unexpected signal %d", signo); 

578 } 

579 } 

580 } 


[549—562] MM signal thread 由 负责 处 理 信 号 的 线程 运行 。 在 main 函数 中 初始 化 信号 掩 
码 ， 该 掩 码 包括 SIGHUP 和 SIGTERM。 这 里 ， 调 用 sigwait 来 等 待 这 些 信号 中 
的 一 个 出 现 。 如 果 sigwait 失败 ， 记 录 出 错 日 志 并 退出 。 

[563—570] ”如 果 接 收 到 SIGHUP， 然 后 获得 configlock 互 斥 量 ,将 reread 变量 设 为 1， 释放 
互 斥 量 。 这 就 告诉 打印 机 守护 进程 在 其 处 理 循环 的 下 一 次 迭代 时 再 次 读 取 配 置 文件 。 

[571—574] ”如 果 接 收 到 SIGTERM, 调用 kill workers 来 杀 死 所 有 的 工作 者 线程 , 记录 日 志 ， 
然后 调用 exit 终止 进程 。 

[575—580] ”如 果 接 收 到 非 期 望 的 信号 , 则 杀 死 工作 者 线程 并 调用 10g quit 来 记录 日 志 然 
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/ 





后 退出 。 


* 


* Add an option to the IPP header. 
* 

* LOCKING: none. 

XE 


char * 


add option(char *cp, int tag, char *optname, char *optval) 


{ 


) 


int n; 
union { 
intl6.t s; 
char c[2]; 
} u; 


*cptt = tag; 

n = strlen(optname); 
u.s - htons (n); 
*cpt* = u.c[0]; 
*cp++ = u.c[1]; 
strcpy(cp, optname); 
cp += n; 

n = strlen(optval); 
u.s = htons(n); 
*ept++ = u.c[0]; 
*cpt* = u.c[1]; 
strcpy(cp, optval); 
return(cp + n); 


[581—593] PAM add option 用 于 在 送 到 打印 机 的 IPP 首部 中 添加 一 个 选项 ， 回 忆 图 21-4, 


属性 的 格式 是 1 字 节 的 描述 属性 类 型 的 标志 ， 然 后 是 以 2 字 节 的 二 进 制 整数 形式 
存储 的 属性 名 字 的 长 度 ， 接 着 是 名 字 ， 属 性 值 的 长 度 ， 最 后 是 属性 值 本 身 。 

IPP 没有 打算 去 控制 嵌入 在 首部 的 二 进 制 整数 的 对 齐 方式 。 一 些 处 理 嚣 架构, 例如 
SPARC， 并 不 能 从 任意 地 址 装 入 一 个 整数 。 这 意味 着 不 能 通过 如 下 方式 在 IPP 首 
部 存放 一 个 整数 : 该 方式 将 一 个 指针 转换 成 int16 c 指向 在 首部 存放 整数 的 地 
址 。 相 反 ， 需 要 一 次 复制 1 字 节 整数 。 这 就 是 为 什么 我 们 定义 一 个 包含 16 位 整数 
和 2 字 节 数组 的 union。 


[594—607] ”在 首部 存储 标志 并 将 属性 名 字 的 长 度 转换 为 网 络 字 节 序 。 一 次 复制 1 个 字 节 到 首 


部 。 接 着 复制 属性 名 字 。 重 复 这 个 过 程 ， 继 续 复制 属性 值 ， 并 返回 首部 中 下 一 个 
应 该 开始 的 部 分 的 地 址 。 


/* 


* Single thread to communicate with the printer. 

* 

* LOCKING: acquires and releases joblock and configlock. 
^ 


void * 
printer thread(void *arg) 


{ 


struct job *jPp; 
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[608~627] PAL printer thread 由 与 网 络 打印 机 通信 的 线程 运行 。 使 用 icp 和 ibuf 来 
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int hlen, ilen, sockfd, fd, nr, nw, extra; 
char *icp, *hop, Ti 

struct ipp hdr *hp; 

struct stat sbuf; 

struct iovec iov[2]; 

char name [FILENMSZ]; 

char hbuf [HBUFSZ]; 

char ibuf[IBUFSZ]; 

char buf [IOBUFSZ]; 

char str[64]; 


struct timespec ts = { 60, 0 }; /* 1 minute */ 


for (zr) { 
/* 
* Get a job to print. 
*/ 


pthread mutex lock(&joblock); 

while (jobhead == NULL) { 
log msg("printer thread: waiting..."); 
pthread cond wait(&jobwait, &joblock); 

} 

remove_job(jp = jobhead) ; 

log msg("printer thread: picked up job %d", jp-»jobid); 

pthread mutex unlock(&joblock); 

update jobno():; 


建立 IPP 首部 。 使 用 hcp 和 hbuf 建立 HTTP 首部 。 需 要 在 独立 的 缓冲 区 中 建立 
首部 。HTTP 首部 包括 ASCII 表示 的 长 度 字 段 ， 而 且 在 拼装 出 IPP 首部 之 前 ， 并 
不 知道 应 该 预 留 多 大 的 空间 。 在 一 次 调用 中 使 用 writev 来 写 这 两 个 头 。 


[628~640] 打印 机 线程 在 一 个 等 待 将 作业 传送 到 打印 机 的 无 限 循 环 中 运行 。 使 用 joblock 
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互 斥 量 来 保护 作业 列表 。 如 果 作 业 没 有 挂 起 ， 使 用 pthread cond wait 来 等 
待 到 来 的 作业 。 当 一 个 作业 准备 好 时 ， 调 用 remove job 将 其 从 列表 中 删除 。 
此 时 仍 持 有 互 斥 量 ， 因 此 释放 互 斥 量 并 调用 update jobno 将 下 一 个 作业 号 编 


写 入 到 /var/spool/printer/jobno。 
/* 
* Check for a change in the config file. 
ey 
pthread_mutex_lock (&configlock) ; 
if (reread) { 
freeaddrinfo (printer); 
printer = NULL; 
printer_name = NULL; 
reread = 0; 
pthread_mutex_unlock (&configlock) ; 
init_printer(); 
} else { 
pthread_mutex_unlock (&configlock) ; 


/* 
* Send job to printer. 


[833 
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*y 
sprintf (name, "%s/%s/%ld", SPOOLDIR, DATADIR, jp->jobid); 
if ((fd = open (name, O RDONLY)) < 0) { 
log msg("job $1d canceled - can't open $s: $s", 
jp->jobid, name, strerror(errno)); 
free(jp); 
continue; 
} 
if (fstat(fd, &sbuf) < 0) { 
log msg("job $1d canceled - can't fstat $s: %s", 
jp->jobid, name, strerror(errno)); 
free (jp); 
close (fd); 
continue; 


现在 有 了 要 打印 的 作业 ， 检 查 一 下 配置 文件 有 无 改变 。 锁 住 configlock LFE 
并 检查 reread 变量 。 如 果 该 值 非 0， 那 么 释放 旧 的 addrinfo 列表 ， 清 空 指针 ， 
解锁 互 斥 量 ， 然 后 调用 init printer 来 重新 初始 化 指针 信息 。 既 然 从 main X 
程 初始 化 后 只 有 这 个 上 下 文 可 以 查看 并 可 能 更 改 打印 机 信息 ， 因 此 除了 使 用 
configlock 互 斥 量 来 保护 reread 标志 的 状态 外 , 不 需要 任何 其 他 的 同步 手段 。 
注意 ,尽管 在 此 函数 中 获得 和 释放 两 个 不 同 互 斥 量 , 但 是 并 没有 同时 持 有 两 个 互 斥 
量 ， 因 此 不 需要 建立 一 个 锁 层 次 〈 见 11.6.2 节 )。 

如 果 不 能 打开 数据 文件 ， 则 记录 出 错 日 志 , 释放 job 结构 ， 然 后 继续 。 打 开 文 件 之 后 ， 
调用 fstat 来 找到 文件 的 大 小 。 如 果 失 败 ， 记 录 出 错 日 志 并 清理 ， 然 后 继续 。 


if ((sockfd = connect_retry(AF_INET, SOCK_STREAM, 0, 
printer->ai_addr, printer->ai_addrlen)) < 0) { 
log msg("job $d deferred - can’t contact printer: %s", 
jp->jobid, strerror(errno)); 
goto defer; 


/* 

* Set up the IPP header. 
*/ 

icp = ibuf; 


hp = (struct ipp hdr *)icp; 

hp-»major version = 1; 

hp-»minor version = 1; 

hp->operation = htons(OP PRINT JOB); 

hp-»request id = htonl(jp-»jobid); 

icp += offsetof(struct ipp hdr, attr group); 

*icp++ = TAG OPERATION ATTR; 

icp = add option(icp, TAG CHARSET, "attributes-charset", 
"utf-8"):; 

icp = add option(icp, TAG NATULANG, 
"attributes-natural-language", "en-us"); 

sprintf(str, "http://$s/ipp", printer name); 

icp = add option(icp, TAG URI, "printer-uri", str); 

icp = add option(icp, TAG NAMEWOLANG, 
"requesting-user-name", jp-»req.usernm); 
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[699—708] 
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icp = add option(icp, TAG NAMEWOLANG, "job-name", 
jp->req.jobnm) ; 


打开 一 个 连接 到 打印 机 的 流 套 接 字 。 如 果 connect retry 调用 失败 , BESI defer 
处 ， 在 这 里 清理 、 延 迟 一 段 时 间 ， 然 后 再 尝试 。 
接 下 来 ， 建 立 IPP 首部 。 其 操作 是 打印 作业 (print-job) 请 求 。 使 用 htons 将 2 字 
节 的 操作 ID 从 主机 转换 为 网 络 字 节 序 ， 使 用 htonl 将 4 字 节 的 作业 ID 从 主机 转 
换 为 网 络 字 节 序 。 完 成 首部 的 初始 化 之 后 ， 设 置 标志 值 来 指示 其 后 跟随 操作 属性 。 
调用 add option 将 属性 添加 到 报 文中 。 图 12-5 列 出 了 打印 作业 请 求 所 需 的 操作 
属性 ， 前 3 个 是 必需 的 。 将 字符 集 设 为 UTF-8， 该 字符 集 是 打印 机 必须 支持 的 ; 指 
定语 言 为 en-us， 即 代表 美国 英语 (U.S. English; 另外 一 个 必需 的 属性 是 URI 
(Uniform Resource Identifier)， 将 其 设 为 http://printer_name/ipp。 
推荐 使 用 requesting-user-name 属性 ， 但 不 是 必需 的 。job-name 属性 也 是 
可 选 的 。print 命令 将 要 打印 的 文件 名 作为 作业 名 发 送 , 该 名 字 能 够 帮助 用 户 区 别 
多 个 要 处 理 的 作业 。 

if (jp->req.flags & PR_TEXT) { 


p = "text/plain"; 
extra = 1; 


} else { 
p = "application/postscript"; 
extra - 0; 


) 

icp = add option(icp, TAG MIMETYPE, "document-format", p); 
*icp** = TAG END OF ATTR; 

ilen = icp - ibuf; 


/* 

* Set up the HTTP header. 
ae 

hep = hbuf; 


sprintf(hcp, "POST /ipp HTTP/1.1\r\n"); 
hep += strlen (hcp); 


sprintf(hcp, "Content-Length: %ld\r\n", 
(long) sbuf.st_size + ilen + extra); 


hcp += strlen(hcp); 


strcpy (hcp, "Content-Type: application/ipp\r\n") ; 


hep += strlen (hcp); 


sprintf(hcp, "Host: %s:%d\r\n", printer name, IPP PORT); 
hcp += strlen(hcp); 

*hept+ = 'Nr'; 

*hep++ = 'Mn'; 


hlen = hep - hbuf; 


提供 的 最 后 一 个 属性 是 document-format。 如 果 省 略 该 属性 ， 则 假定 文件 格式 
是 打印 机 默认 格式 。 对 于 PostScript 打印 机 ,格式 可 能 是 PostScript， 但 是 一 些 打 印 
机 可 以 自动 检测 格式 并 在 PostScript 与 纯 文 本 或 PCL CHP 的 打印 机 命令 语言 ) 格 
式 间 做 选择 。 如 果 PR TEXT 标志 被 设置 ， 则 将 文档 格式 设置 为 text /plain。 否 
则 ， 设 置 为 application/postscript。 然 后 在 属性 结束 处 用 结束 属性 标志 定 
界 并 计算 IPP 首部 的 大 小 。 


678 第 21 章 与 网 络 打 印 机 通信 


整数 extra 用 来 记录 任何 可 能 需要 传输 到 打印 机 的 附加 字符 。 稍 后 会 看 到 ， 需 要 
发 送 一 个 附加 字符 以 能 够 可 靠 地 打印 纯 文 本 。 当 要 计算 内 容 长 度 时 ， 需 要 考虑 这 个 
附加 字符 。 

[709—724] ”现在 知道 了 IPP 首部 的 大 小 , 可 以 建立 HTTP 首部 .将 Context-Length WW IPP 
首部 的 字 节 长 度 加 上 要 打印 文件 的 大 小 再 加 上 需要 发 送 的 附加 字符 的 长 度 。 
Content-Type 为 application/ipp。 用 回 车 换行 符 结束 HTTP 首部 。 最 后 ， 


835 计算 HTTP 首部 的 大 小 。 
725 LF 
726 * Write the headers first. Then send the file. 
723 */ 
728 iov[0].iov base = hbuf; 
729 iov[0].iov len = hlen; 
730 iov[1].iov base = ibuf; 
731 iov[1].iov len = ilen; 
732 if (writev(sockfd, iov, 2) !- hlen + ilen) { 
733 log ret("can't write to printer"); 
734 goto defer; 
735 ) 
736 if (jp->req.flags & PR TEXT) { 
737 /* 
738 * Hack: allow PostScript to be printed as plain text. 
739 id 
740 if (write(sockfd, "Mb", 1) != 1) { 
741 log ret("can't write to printer"); 
742 goto defer; 
743 ) 
744 } 
745 while ((nr = read(fd, buf, IOBUFSZ)) > 0) { 
746 if ((nw = writen(sockfd, buf, nr)) != nr) { 
747 if (nw < 0) 
748 log_ret ("can't write to printer"); 
749 else 
750 log_msg ("short write (%d/%d) to printer", nw, nr); 
751 goto defer; 
752 } 
753 } 


[725—735] 将 iovec 数组 的 第 一 个 元 素 指 向 HTTP 首部 ， 第 二 个 元 素 指向 IPP 首部 。 然 后 采 
用 writev 将 两 个 首部 送 往 打 印 机 。 如 果 写 失败 或 者 写 入 少 于 请 求 的 字 节 数 ， 则 记 
录 日 志 并 跳 转 到 defer， 在 这 里 清理 并 延迟 一 段 时 间 ， 然 后 再 次 尝试 。 

[736—744] ”即使 指明 了 纯 文本 ,Phaser 8560 还 是 会 自动 检测 文档 格式 。 为 了 防止 它 识别 出 要 以 
纯 文 本 格式 打印 的 文件 的 开头 ， 将 退 格 作为 第 一 个 发 送 字 符 ， 这 个 字符 不 会 被 打印 
出 来 ， 并 且 能 够 使 自动 识别 文件 格式 功能 失效 。 这 就 可 以 打印 PostScript 源 文件 而 
不 用 打印 PostScript 文件 的 镜像 。 

[745—753] ”通过 IOBUFSZ 块 将 数据 文件 发 往 打 印 机 。 当 套 接 字 缓冲 区 满 的 时 候 ，write 的 发 
送 少 于 请 求 ， 因 此 可 以 用 write 处 理 这 种 情况 。 当 写 首部 时 ， 不必 担心 这 种 情况 ， 

因为 它们 都 很 小 ， 但 要 打印 的 文件 却 是 很 大 的 。 


754 
755 
756 
Tat 


758 
759 
760 
761 
762 
763 
764 
765 
766 
767 
768 
769 
770 
771 
772 
773 
774 
TT75 
776 
777 


778 
779 
780 
781 
782 
783 
784 
785 


[754—757] ” 读 到 文件 末尾 时 ，read 返回 0。 如 果 读 失败 ， 记 录 错 误 信息 日 志 并 跳 至 defer. 
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if (nr < 0) { 
log_ret ("can’t read %s", name); 
goto defer; 

} 


/* 
* Read the response from the printer. 
*f 
if (printer status(sockfd, jp)) { 
unlink (name); 
sprintf (name, "%s/%s/%d", SPOOLDIR, REQDIR, jp->jobid); 
unlink (name); 
free(jp); 
jp = NULL; 
} 
defer: 
close (fd); 
if (sockfd >= 0) 
close (sockfd); 
if (jp != NULL) { 
replace_job(jp); 
nanosleep(&ts, NULL); 


) 
} 


/* 

* Read data from the printer, possibly increasing the buffer. 
* Returns offset of end of data in buffer or -1 on failure. 

* 

* LOCKING: none. 

*/ 


ssize_t 
readmore(int sockfd, char **bpp, int off, int *bszp) 


[758—767] ”将 文件 发 送 给 打印 机 后 ， 调 用 printer status 来 读 取 打 印 机 对 于 请 求 的 响应 。 


如 果 成 功 , printer_status 返回 一 个 非 0 值 , 就 可 以 删除 数据 文件 和 控制 文件 。 
然后 释放 job 结构 ， 将 其 指针 设 为 NULL， 然 后 到 达 defer 标签 。 


[768—777] ”在 defer 标签 处 ， 关 闭 打开 的 数据 文件 描述 符 。 如 果 套 接 字 描 述 符 是 有 效 的 ， 也 


将 其 关闭 。 如 出 错 ，jp 指向 要 打印 作业 的 作业 结构 ， 这 样 就 可 以 将 作业 放 在 挂 起 
作业 列表 的 头 部 然后 延迟 1 分 钟 。 如 果 成 功 ，jp 为 NULL， 此 时 只 需 回 到 循环 开始 
处 ， 获 得 下 一 个 要 打印 的 作业 。 


[778—785] readmore 函数 用 于 读 取 来 自打 印 机 的 部 分 响应 消息 。 


786 
787 
788 
789 


790 
791 
792 


{ 


ssize_t nr; 
char *bp = *bpp; 
int bsz =*bszp; 


if (off >= bsz) { 
bsz += IOBUFSZ; 
if ((bp = realloc(*bpp, bsz)) == NULL) 
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793 log sys("readmore: can't allocate bigger read buffer"); 

794 *bszp -bsz; 

795 *bpp -bp; 

796 ) 

797 if ((nr = tread(sockfd, &bp[off], bsz-off, 1)) > 0) 

798 return (off+nr) ; 

799 else 

800 return (-1); 

801 } 

802° /* 

803 * Read and parse the response from the printer. Return 1 

804 * if the request was successful, and 0 otherwise. 

805 * 

806  * LOCKING: none. 

807 */ 

808 int 

809 printer status(int sfd, struct job *jp) 

810 { 

811 int i, success, code, len, found, bufsz, datsz; 

812 int32 t jobid; 

813 ssize t nr; 

814 char *bp, *cp, *statcode, *reason, *contentlen; 

815 struct ipp hdr h; 

816 {* 

817 * Read the HTTP header followed by the IPP response header. 

818 * They can be returned in multiple read attempts. Use the 

819 * Content-Length specifier to determine how much to read. 

820 A 

[786—801] ”如 果 到 达 缓 冲 区 尾部 , 通过 相应 的 参数 bpp 和 bszp 重新 分 配 一 个 大 一 点 的 缓冲 区 
并 返回 该 新 的 缓冲 区 的 起 始 地 址 以 及 缓冲 区 大 小 。 上 述 任何 一 种 情况 下 ， 从 缓冲 区 
已 读数 据 的 末尾 开始 读 取 缓 冲 区 所 能 容纳 的 尽 可 能 多 的 数据 。 返 回 相应 的 已 读数 据 
的 新 偏 移 量 。 如 果 read 失败 ， 或 者 超时 ， 返回 一 1。 

[802—820] printer status 函数 读 取 打印 机 对 一 个 打印 作业 请 求 的 响应 消息 。 不 知道 打印 机 会 
如 何 响应 : 也 许 会 在 多 个 报 文中 回 送 一 个 响应 ,也 许 在 一 个 报 文中 回 送 完整 的 响应 , 或 
者 包括 一 个 中 间 确 认 ， 诸 如 HTTP 100 continue 报 文 。 需 要 处 理 所 有 的 可 能 性 。 

821 success =0 ; 

822 bufsz =IOBUFSZ; 

823 if ((bp = malloc(IOBUFSZ)) == NULL) 

824 log sys("printer status: can't allocate read buffer"); 

825 while ((nr = tread(sfd, bp, bufsz, 5)) > 0) { 

826 4T 

827 * Find the status. Response starts with "HTTP/x.y" 

828 * so we can skip the first 8 characters. 

829 */ 

830 cp = bp + 8; 

831 datsz =nr; 

832 while (isspace( (int) *cp) ) 

833 Cp++? 

834 statcode =cp; 


215 源 代码 681 











835 while (isdigit((int)*cp)) 

836 CDHE; 

837 if (cp == statcode) { /* Bad format; log it and move on */ 

838 log_msg (bp) ; 

839 } else { 

840 *cpt ="\0'; 

841 reason =cp; 

842 while (*cp != 'Nr' && *cp != 'Mn') 

843 cptt; 

844 žep s'N0'; 

845 code -atoi(statcode); 

846 if (HTTP INFO(code)) 

847 continue; 

848 if (!HTTP SUCCESS (code)) { /* probable error: log it */ 

849 bp[datsz] =’\0’'; 

850 log msg("error: $s", reason); 

851 break; 

852 ) 

[821—838] — 分 配 一 个 缓冲 区 并 读 取 来 自打 印 机 的 数据 ,期 望 5 秒 之 内 有 可 用 的 响应 * 跳 过 HTTP/1 .1 
和 报 文 开始 的 所 有 空格 ， 然 后 是 数字 状态 码 。 如 果 不 是， 在 日 志 中 记录 报 文 的 内 容 。 

[839—844] ”如 果 在 响应 中 找到 一 个 数字 状态 码 , 将 其 开始 的 非 数 字 字 符 转 换 成 null 字 节 (这 一 
字符 是 某 种 形式 的 空白 )。 接 下 来 是 一 个 表明 原因 的 字符 串 〈 文 本 消息 )。 搜 索 回 车 
或 换行 符 ， 并 采用 null 字 节 结束 文本 字符 串 。 

[845—852] WH atoi 函数 将 状态 码 字符 串 转化 成 一 个 整数 。 如 果 仅 是 提供 信息 的 报 文 ， 将 其 
忽略 并 继续 循环 。 我 们 期 望 看 到 的 要 么 是 成 功 消 息 要 么 是 出 错 消息 。 如 果 得 到 出 错 
消息 ， 记 录 出 错 日 志 并 退出 循环 。 839 

853 /* 

854 * HTTP request was okay, but still need to check 

855 * IPP status. Search for the Content-Length. 

856 = 

857 i = cp - bp; 

858 for (s: f 

859 while (*cp != 'C' && *cp !- 'c' && i < datsz) ( 

860 cpt+; 

861 i4. 

862 } 

863 if (i >= datsz) { /* get more header */ 

864 if ((nr = readmore(sfd, &bp, i, &bufsz)) < 0) { 

865 goto out; 

866 } else { 

867 cp =&bp[il; 

868 datsz += nr; 

869 } 

870 } 

871 if (strncasecmp(cp, "Content-Length: ", 15) == 0) { 

872 cp += 15; 

873 while (isspace((int) *cp) ) 

874 cpt+; 

875 contentlen =cp; 

876 while (isdigit ( (int) *cp) ) 

877 cptt; 
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878 
879 
880 
881 
882 
883 
884 
885 
886 


[853~870] 


[871~886] 


887 
888 
889 
890 
891 
892 
893 
894 


895 
896 
897 
898 
899 
900 
901 
902 
903 
904 
905 
906 
907 
908 
909 
910 
911 
912 
913 
914 
915 
916 


917 
918 
919 
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*ept++ =!" \0"; 
i = cp - bp; 
len -atoi(contentlen); 
break; 
} else { 
cpt+t+; 
i++; 


} 
如 果 HTTP 请 求 成 功 , 需要 检查 IPP 状态 。 搜索 整个 报 文 直到 找到 Content-Length 
属性 。HTTP 首部 的 关键 字 是 大 小 写 敏感 的 ， 因 此 需要 同时 检查 小 写 和 大 写字 符 。 如 
果 绥 冲 区 空间 耗 尽 ， 需 要 调用 readmore， 通 过 它 再 调用 realloc 增加 缓冲 区 大 小 。 
因为 缓冲 区 地 址 可 能 改变 ， 需 要 调整 cp 指向 正确 的 缓冲 区 位 置 。 
使 用 strncasecmp 函数 进行 大 小 写 敏感 比较 。 如 果 找 到 Content-Length 属性 字 
符 串 ， 就 搜索 它 的 值 . 将 数字 字符 串 转 换 为 整数 并 退出 这 个 for TAA. 如 果 比 较 失 败 ， 
继续 逐个 字 节 搜索 缓冲 区 。 如 果 直 到 缓冲 区 末尾 仍 未 找到 Content-Length Jatt, 
就 从 打印 机 读 取 更 多 数据 并 继续 搜索 。 


if (i >= datsz) { /* get more header */ 
if ((nr = readmore(sfd, &bp, i, &bufsz)) < 0) { 
goto out; 
} else { 
cp -&bp[i]; 
datsz *- nr; 


} 


found =0 ; 
while (!found) { /* look for end of HTTP header */ 
while (i « datsz - 2) { 
if (*cp == 'Mn' && *(cp + 1) == '"Nr' && 
*(cp + 2) == 'Nn') { 
found =1 ; 
cp += 3; 
i += 3; 
break; 
} 
cp++; 
itt; 
) 
if (i >= datsz) | /* get more header */ 
if ((nr = readmore(sfd, &bp, i, &bufsz)) < 0) { 
goto out; 
} else { 
cp -&bp[i]; 
datsz += nr; 


} 
if (datsz - i < len) { /* get more header */ 


if ((nr = readmore (sfd, &bp, i, &bufsz)) < 0) { 
goto out; 
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920 } else { 
921 cp -&bp[i] 
922 datsz += nr; 





[887—916] ”现在 知道 报 文 的 长 度 了 (通过 Content-Length 属性 )。 如 果 耗 尽 缓冲 区 ， 那 么 
从 打印 机 再 次 读 取 。 接 下 来 搜索 HTTP 首部 的 末尾 (空白 行 )。 如 果 找 到 了 ， 就 设 
置 found 标志 并 跳 过 空白 行 。 无论 何 时 调用 readmore, 都 要 将 cp 设置 为 与 之 前 
指向 的 缓冲 区 偏 移 量 相同 ， 以 防止 重 分 配 时 缓冲 区 地 址 改变 。 

[917—922] ”如 果 找 到 HTTP 首部 的 末尾 , 计算 HTTP 首部 所 用 的 字 节 数 。 如 果 读 取 的 值 减 去 HTTP 
首部 的 大 小 后 不 等 于 PP 报 文 的 数据 长 度 〈 该 值 从 内 容 长 度 Content-Length Pit 











算 )， 需 要 读 取 更 多 的 数据 。 
923 } 
924 } 
925 memcpy (&h, cp, sizeof) (struct ipp hdr); 
926 i = ntohs(h.status); 
927 jobid = ntohl(h.request id); 
928 if (jobid != jp->jobid) { 
929 Le 
930 * Different jobs. Ignore it. 
931 £7 
932 log_msg("jobid %d status code %d", jobid, i); 
933 break; 
934 } 
935 if (STATCLASS_OK (i) ) 
936 success = 1; 
937 break; 
938 } 
939 } 
940 out: 
941 free (bp); 
942 if (nr < 0) { 
943 log_msg("jobid %d: error reading printer response: %s", 
944 jobid, strerror (errno)); 
945 } 
946 return (success); 
947 } 


[023—927] M IPP 首部 中 获取 状态 和 作业 ID 。 两 者 均 以 网 络 字 节 序 的 整数 形式 存储 ， 因 此 需 


要 调用 ntohs 和 ntohl 将 其 转换 为 主机 字 节 序 。 

[928 一 939] “如果 作业 ID 不 匹配 ， 表 明 并 非 是 对 我 们 请 求 的 响应 ， 那 么 记录 日 志 并 退出 外 层 
while 循环 。 如 果 IPP 状态 指示 为 成 功 ， 保 存 返回 值 并 退出 循环 。 

[940 一 947] ”在 退出 之 前 ， 要 释放 用 来 存放 响应 报 文 的 缓冲 区 。 如 果 打 印 请 求 成 功 则 返回 1， 否 则 
失败 ， 返 回 0。 

这 里 总 结 本 章 中 这 个 扩展 的 例子 。 本 章 中 的 程序 在 Xerox Phaser 8560 网 络 PostScript 打印 机 
上 测试 。 遗 憾 的 是 ， 当 文档 格式 设置 为 text/plain 时 ， 这 个 打印 机 并 没有 禁止 它 的 自动 识别 
格式 功能 。 我 们 使 用 了 一 个 小 技巧 ， 使 得 在 想 要 以 纯 文本 格式 对 待 一 个 文档 时 ， 打 印 机 不 自动 识 
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别 文档 格式 。 一 种 替代 的 方法 是 使 用 诸如 a2ps(1) 这 样 的 实用 工具 将 源 打印 成 一 个 PostScript 程 


序 。 


a2ps(1) 可 以 在 打印 前 封装 PostScript 程序 。 


21.6 小结 


本 章 仔细 考查 了 两 个 完整 的 程序 : 一 个 打印 假 脱 机 守护 进程 将 作业 发 送 到 网 络 打 印 机 和 一 个 


命令 行程 序 将 打印 作业 提交 到 假 脱 机 守护 进程 。 这 给 我 们 一 个 机 会 ， 考 查 在 一 个 实际 程序 中 使 用 
前 面 章 节 所 讲述 的 许多 特性 ， 如 线程 、L/O 多 路 技术 、 文 件 TO、 套 接 字 IO 以 及 信号 。 


习题 


21. 


bh 


21.2 


21.3 


21.4 
21.5 


21.6 


21.7 


21.8 


21.9 


将 ipp.h 中 所 列 的 IPP 错误 码 转换 成 错误 消息 。 然 后 修改 打印 假 脱 机 守护 进程 ， 当 IPP 首 
部 指示 有 打印 机 错误 时 ， 在 printer_status 函数 结尾 处 记录 日 志 。 

增强 print MQM printad 守护 进程 ， 使 得 用 户 可 以 请 求 双 面 打印 ， 并 支持 横向 打印 和 纵 
向 打印 。 

修改 打印 假 脱 机 守护 进程 ， 当 其 开始 时 ， 能 够 联系 打印 机 并 找 出 所 支持 的 特性 ， 这 样 守护 
进程 就 不 会 请 求 打印 机 不 支持 的 选项 。 

写 一 个 命令 行程 序 来 报告 挂 起 的 打印 作业 状态 。 

写 一 个 命令 行程 序 来 取消 一 个 挂 起 的 打印 作业 。 使 用 作业 ID 作为 命令 参数 来 指明 取消 哪个 
作业 。 如 果 防 止 一 个 用 户 取消 另 一 个 用 户 的 打印 作业 ? 

在 打印 假 脱 机 守护 进程 中 支持 多 个 打印 机 ， 并 包括 将 一 个 打印 作业 从 本 打印 机 移 到 另 一 个 
打印 机 的 方式 。 

解释 为 什么 在 打印 机 守护 进程 中 ， 当 信和 号 处 理 线程 捕捉 到 SIGHUP 并 将 reread 设置 为 1 
时 ， 不 需要 唤醒 打印 机 线程 ? 

在 printer_status 函数 中 , 通过 查找 HTTP 的 Content-Length 属性 搜索 IPP 报 文 的 
长 度 。 这 一 技术 在 使 用 块 传输 编码 的 打印 机 上 不 起 作用 。 在 RFC 2616 中 查找 块 消息 是 如 何 
格式 化 的 ， 然 后 修改 printer_status， 使 其 也 能 够 支持 这 种 形式 的 响应 。 

f£ update jobno 函数 中 ， 当 下 一 个 作业 编号 从 最 大 正 值 回 绕 到 1 时 (参见 get_newjobno), 
可 能 会 将 一 个 较 大 的 编号 改写 为 一 个 较 小 的 编号 。 这 可 能 导致 守护 进程 重启 时 读 到 一 个 错 
误 的 编号 。 对 于 这 一 问题 是 否 有 简单 的 解决 方法 ? 





附录 A 





本 附录 包含 了 正文 中 说 明 过 的 标准 ISO C. POSIX Ail UNIX 系统 的 函数 原型 。 通 常 我 们 想 了 
解 的 是 函数 的 参数 (fgets 的 哪 一 个 参数 是 文件 指针 ? ) 或 者 返回 值 (sprintf 返回 的 是 指针 
还 是 计数 值 ?”)。 这 些 函 数 原型 还 说 明了 要 包含 哪些 头 文件 ， 以 获得 特定 常量 的 定义 ， 或 获得 ISO 
C 函数 原型 ， 以 帮助 在 编译 时 进行 错误 检测 。 

每 个 函数 原型 的 引用 页 号 出 现在 为 该 函数 列 出 的 第 一 个 头 文件 的 右边 。 引 用 页 号 提供 的 是 包 
含 该 函数 原型 的 页 。 为 获得 该 函数 原型 的 附加 信息 可 参阅 该 页 。 

某 些 函 数 原型 仅 受 本 书 说 明 的 4 种 平台 中 某 几 种 的 支持 。 另 外 ， 某 些 平 台 支 持 的 函数 标志 在 
男 一 些 平台 上 并 不 提供 支持 。 对 于 这 些 情况 ,我们 通常 列 出 提供 支持 的 平台 。 但 是 对 于 有 些 情况 ， 
我 们 列 出 了 不 提供 支持 的 平台 。 

本 附录 中 标注 的 页 码 为 英文 版 原 书 的 页 码 ， 与 书 中 页 边 标注 的 页 码 对 应 。 


void abort (void); 
<stdlib.h> p. 365 
此 函数 不 返回 值 
int accept (int sockfd, struct sockaddr *restrict addr, 
socklen_t *restrict len); 
<sys/socket.h> p. 608 
返回 值 : 若 成 功 ， 返 回 文件 《〈 套 接 字 ) 描述 符 ， 若 出 错 则 返回 -1 845 


int access(const char *path, int mode); 
«unistd.h» p. 102 
mode: R OK. W OK. X OK. F OK 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


int aio cancel(int fd, struct aiocb *aiocb) ; 
<aio.h> p. 514 
返回 值 : ATO_ALLDONE, AIO CANCELED. AIO NOTCANCELED; 若 出 错 ， 返 回 -1 
int aio error(const struct aiocb *aiocb); 
<aio.h> p. 513 


返回 值 : 若 操作 成 功 ， 返 回 0; 若 操作 仍 在 进行 中 ， 返 回 EINPROGRESS; Zi 
作 失 败 ， 返 回 错误 码 ; 若 出 错 ， 返 回 -1 


int aio fsync(int op, struct aiocb *aiocb); 
<aio.h> p. 513 
返回 值 : FRH, WO, 若 出 错 ， 返 回 -1 

int aio read(struct aiocb *aiocb) ; 
«aio h» p. 512 


返回 值 : 若 成 功 则 ， 返 回 0; 若 出 错 则 返回 -1 


ssize t aio return(const struct aiocb *aiocb) ; 
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int 


int 


unsigned 
int 


int 


int 


void 


speed_t 


speed_t 


int 


int 


int 


int 


int 


void 


int 


<aio.h> 


返回 值 : 异步 操作 的 结果 ; 若 出 错 ， 返 回 -1 


aio suspend(const struct aiocb *const list[], int nent, 
const struct timespec *timeout); 
<aio.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


aio write(struct aiocb *aiocb); 
«aio.h» 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


alarm (unsigned int seconds); 
<unistd.h> 


返回 值 : 0 或 以 前 设置 的 闹钟 时 间 的 余 留 秒 数 


atexit(void (*func) (void) ) ; 
<stdlib.h> 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 非 0 


bind(int sockfd, const struct sockaddr *addr, socklen t len); 


<sys/socket.h> 


返回 值 : 若 成 功 ， 返 回 o. 若 出 错 ， 返 回 -1 


*calloc(size t nobj, size t size); 
<stdlib.h> 
返回 值 : FRJ, BERE: Fh, REl NULL 


cfgetispeed(const struct termios *termptr) ; 
«termios.h» 


返回 值 : 返回 波 特 率 值 


cfgetospeed(const struct termios *termptr); 
<termios.h> 


返回 值 : 返回 波 特 率 值 


cfsetispeed(struct termios *fermptr, speed t speed) ; 
<termios.h> 


返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 


cfsetospeed(struct termios *fermptr, speed t speed); 
<termios.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


chdir(const char *path) ; 
<unistd.h> 


返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 


chmod(const char *path, mode_t mode) ; 
«sys/stat.h» 
mode: S IS[UG]ID. S ISVTX. 
S I[RWX] (USR|GRP|OTH) 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


chown(const char *path, uid_t owner, gid_t group); 
<unistd.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


clearerr (FILE *fp); 
<stdio.h> 


clock_getres(clockid_t clock id, struct timespec *fsp); 
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int 
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<sys/time.h> 

clock id: CLOCK_REALTIME, CLOCK_MONOTONIC, 
CLOCK PROCESS CPUTIME ID. 
CLOCK THREAD CPUTIME ID 

返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


clock gettime(clockid t clock id, struct timespec *ísp); 
<sys/time.h> 
clock id: CLOCK_REALTIME, CLOCK MONOTONIC, 
CLOCK PROCESS CPUTIME ID. 
CLOCK THREAD CPUTIME ID 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


clock_nanosleep(clockid_t clock_id, int flags, 
const struct timespec *reqtp, 
structtimespec *remip); 
«time.h» 
clock id: CLOCK_REALTIME, CLOCK_MONOTONIC, 
CLOCK PROCESS CPUTIME ID. 
CLOCK THREAD CPUTIME ID 
flags: TIMER ABSTIME 
返回 值 ， 若 休眠 够 要 求 的 时 间 ， 返 回 0; 若 失败 ， 返 回 错误 码 


clock settime(clockid t clock id, const struct timespec *fsp) ; 
<sys/time.h> 
clock id: CLOCK_REALTIME, CLOCK_MONOTONIC, 
CLOCK PROCESS CPUTIME ID. 
CLOCK THREAD CPUTIME ID 
返回 值 : FRH, IO; 若 出 错 ， 返 回 -1 


close(int fd); 
<unistd.h> 


返回 值 : 车 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


closedir(DIR *dp); 
«dirent.h» 


返回 值 ， 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


closelog (void); 
<syslog.h> 


*CMSG DATA (struct cmsghdr *cp); 
<sys/socket.h> 


返回 值 : 一 个 指针 ， 指 向 与 cmsghdr 结构 相关 联 的 数据 


*CMSG FIRSTHDR(struct msghdr *mp); 
<sys/socket.h> 


p. 190 


p. 189 


p. 375 


p. 190 


p. 66 


p. 130 


p. 470 


p. 645 


p. 645 


返回 值 :一 个 指针 ， 指 向 与 msghdr 结构 相关 联 的 第 一 个 cmsghdr 结构 ， 若 


无 这 样 的 结构 ， 返 回 NULL 


CMSG LEN (unsigned int nbytes); 
<sys/socket.h> 


返回 值 : A nbytes 长 的 数据 对 象 分 配 的 长 度 


*CMSG_NXTHDR(struct msghdr *mp, struct cmsghdr *cp); 
<sys/socket.h> 


p. 645 


p. 645 


返回 值 : 一 个 指针 ， 指 向 与 msghdr 结构 相关 联 的 下 一 个 msghdr 结构 , 该 msghdr 
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结构 给 出 了 当前 的 cmsghdr 结构 ， 若 当前 cmsghdr 结构 已 是 最 后 一 
个 ， 返 回 NULL 


int connect (int sockfd, const struct sockaddr *addr, 
socklen_t len); 
<sys/socket.h> p. 605 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


int creat(const char *path, mode t mode); 
«fcntl.h» p. 66 
mode: S IS[UG]ID. S ISVTX. 
S I[RWX] (USR|GRP|OTH) 
返回 值 ， 若 成 功 ， 返 回 为 只 写 打开 的 文件 描述 符 ， 车 出 错 ， 返 回 -1 


char *ctermid(char *ptr); 
<stdio.h> p. 694 
返回 值 ， 若 成 功 ， 返 回 指向 控制 终端 名 的 指针 ， 若 出 错 ， 返 回 指向 空 字符 串 的 
指针 


int dprintf(int fd, const char *restrict format, ...); 
<stdio.h> p. 159 
返回 值 ， 若 成 功 ， 返 回 输出 字符 数 ; 若 输出 出 错 ， 返 回 负 值 


int dup (int fd); 
<unistd.h> p: 79 
返回 值 : 若 成 功 ， 返 回 新 的 文件 描述 符 ， 若 出 错 ， 返 回 -1 


int dup2 (int fd, int fd2); 
<unistd.h> p. 79 
返回 值 : 若 成 功 ， 返 回 新 的 文件 描述 符 ; 若 出 错 ， 返 回 -1 


void endgrent (void) ; 
<grp.h> p. 183 


void endhostent (void) ; 
<netdb.h> p. 597 


void endnetent (void) ; 
<netdb.h> p. 598 


void endprotoent (void) ; 
«netdb.h» p. 598 


void endpwent (void); 
<pwd.h> p. 180 


void endservent (void) ; 
<netdb.h> p. 599 


void endspent (void) ; 
<shadow.h> p. 182 
平台 : Linux 3.2.0, Solaris 10 


int execl (const char *path, const char *arg0, ... /* (char *) 0 */ ); 
<unistd.h> p. 249 
返回 值 : 车 出 错 ， 返 回 -1; FRH, MaE 


int execle (const char *path, const char *arg0, ... /* (char *) 0, 
char *const envp[] */ ); 
<unistd.h> p. 249 
返回 值 ， 若 出错， 返回 -1; 车 成 功 ， 不 返回 


int execlp(const char *filename, const char *arg0, 
/* (char *) 0 */ ); 


int 


int 


int 


void 


void 


void 


int 


int 


int 


int 


int 


int 


<unistd.h> 


返回 值 : 若 出 错 ， 返 回 -1;， FRJ, MAE 


execv(const char *path, char *const argv[]); 
<unistd.h> 


返回 值 : 若 出 错 ， 返 回 -1; FRH, MaE 


execve (Const char *path, char *const argv[], 
char *const envp[]); 
<unistd.h> 


返回 值 : 若 出 错 ， 返 回 -1;， 车 成 功 ， 不 返回 


execvp(const char *filename, char *const argv[]); 
<unistd.h> 


返回 值 : 若 出 错 ， 返 回 -1， FRJ, MEE 


Exit (int status); 
<stdlib.h> 
这 个 函数 从 不 返回 


_exit (int status); 
<unistd.h> 


这 个 函数 从 不 返回 


exit(int status) ; 
<stdlib.h> 
这 个 函数 从 不 返回 
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faccessat(int fd, const char *path, int mode, int flag); 


«unistd.h» 

mode: R OK. W OK. X OK. F OK 

flag: AT EACCESS 

返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


fchdir(int fd); 
<unistd.h> 


返回 值 ， 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 


fchmod (int fd, mode 七 mode); 
<sys/stat.h> 
mode: S_IS[UG]ID, S_ISVTX, 
S_I [RWX] (USR|GRP| OTH) 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


fchmodat(int fd, const char *path, mode t mode, 
<sys/stat.h> 
mode: S IS[UG]ID, S ISVTX, 
S I[RWX] (USR|GRP|OTH) 
flag: AT SYMLINK NOFOLLOW 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


fchown(int fd, uid t owner, gid t group); 
«unistd.h» 


返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 


Echownat (int fd, const char *path, uid t owner, 
gid tgroup, int /lag); 
«unistd.h» 
flag: AT SYMLINK NOFOLLOW 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


int flag) ; 
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int 


int 


int 


void 


int 


FILE 


DIR 


void 


void 


int 


int 


int 


int 


int 


int 


char 


fclose(FILE *fp); 


<stdio.h> 

返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 EOF 
fentl (int fd, int cmd, ... /* int arg */ ); 

«fcntl.h» 


cmd: F DUPFD. F DUPFD CLOEXEC. F GETFD. 
F SETFD. F GETFL. F SETFL. F GETOWN, 
F SETOWN. F GETLK. F SETLK. F SETLKW 

返回 值 : 若 成 功 ， 依 赖 于 cmd; 若 出 错 ， 返 回 -1 


fdatasync(int fd); 
«unistd.h» 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


平台 : Linux 3.2.0、Solaris 10 


FD_CLR(int fd, fd set *fdset) ; 
<sys/select.h> 


FD ISSET(int fd, fd set *fdset); 
<sys/select.h> 


返回 值 : 若 应 在 描述 符 集中 ， 返 回 非 0 值 ; 否则 ， 返 回 0 


*fdopen(int fd, const char *fype); 

<stdio.h> 

type: Wy". "gt ma te "rrUua "wH", "a+" 

返回 值 ， 车 成 功 ， 返 回 文件 指针 ; 若 出 错 ， 返 回 NULL 
*fdopendir (int fd); 


<dirent.h> 


返回 值 : 若 成 功 ， 返 回 指 针 ; 若 出 错 ， 返 回 NULL 


FD SET(int fd, fd set *fdset) ; 
<sys/select.h> 


FD ZERO(fd set *fdset) ; 
<sys/select.h> 


feof (FILE *fp); 
<stdio.h> 


返回 值 : 若 到 达 流 的 文件 尾 端 ， 返 回 非 0 GD) ; 否则 ， 返 回 0 ( 假 ) 


ferror(FILE *fp); 
<stdio.h> 


返回 值 : 若 流出 错 ， 返 回 非 GO: 和 否则， 返回 0〈 假 ) 


fexecve(int fd, char *const argv[], char *const envp[]); 
«unistd.h» 


返回 值 ， 若 出 错 ， 返 回 -1; 若 成 功 ， 不 返回 值 


fflush (FILE *fp); 
<stdio.h> 


返回 值 : 车 成 功 ， 返 回 0; 若 出 错 ， 返 回 EOF 


fgetc(FILE *fp); 
<stdio.h> 


p. 150 


p. 503 


p. 503 


p. 148 


p. 130 


p. 503 


p. 503 


p. 151 


p. 151 


p. 147 


p. 150 


返回 值 : 若 成 功 ， 返 回 下 一 个 字符 ; SOBA Rea, E EOF 


fgetpos(FILE *restrict fp, fpos t *restrict pos); 
«stdio.h» 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 非 0 


*fgets(char *restrict buf, int n, FILE *restrict fp); 


int 


void 


FILE 


FILE 


pid_t 


long 


int 


int 


int 


size t 


void 


void 


FILE 
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<stdio.h> p. 152 
返回 值 : 若 成 功 ， 返 回 buf, 若 已 到 达 文 件 尾 端 或 出 错 ， 返 回 NULL 


fileno(FILE *fp); 
<stdio.h> p. 164 
返回 值 : 与 该 流 相 关联 的 文件 描述 符 ， 若 出 错 ， 返 回 -1 


flockfile(FILE *fp); 
<stdio.h> p. 443 


*fmemopen (void *restrict buf, size t size, 
const char *restrict fype); 
<stdio.h> p. 171 
type: "yu. "matu qat "yg". "wt", "ar" 


返回 值 ， 若 成 功 ， 返 回流 指针 ;， 若 错误 ， 返回 NULL 


*fopen (const char *restrict path, const char *restrict type); 
<stdio.h> p. 148 
type: Was. ii^ Lits "an. Wry "wH", "nad" 


返回 值 : 车 成 功 ， 返 回 文件 指针 ; 若 出 错 ， 返 回 NULL 


fork (void); 
<unistd.h> p. 229 
返回 值 : 若 在 子 进程 中 ， 返 回 0; 若 在 父 进程 中 ， 返 回 子 进程 ID; 若 出 错 ， 返 回 -1 


fpathconf (int fd, int name); 
<unistd.h> p. 42 
name: PC ASYNC IO. _PC_CHOWN_RESTRICTED, 
.PC FILESIZEBITS. PC LINK MAX. 
PC MAX CANON. PC MAX INPUT, 
PC NAME MAX, PC NO TRUNC. PC PATH MAX. 
PC PIPE BUF. PC PRIO IO. PC SYMLINK MAX. 
PC SYNC IO. PC TIMESTAMP RESOLUTION. 
PC 2 SYMLINKS. PC VDISABLE 


返回 值 : 若 成 功 ， 返 回 相 应 值 ， 若 出 错 ， 返 回 -1 853 
fprintf (FILE *restrict fp, const char *restrict format, ...); 
<stdio.h> p. 159 


返回 值 : 若 成 功 ， 返 回答 出 字符 数 ， 若 输出 出 错 ， 返 回 负 值 


fputc(int c, FILE *fp); 
<stdio.h> p. 152 
返回 值 : FRH, BE c 若 出 错 ， 返 回 EOF 


fputs(const char *restrict str, FILE *restrict Ip: 
«stdio.h» p. 153 
返回 值 : 车 成 功 ， 返 回 非 负 值 ， 若 出 错 ， 返 回 EOF 


fread(void *restrict ptr, size_t size, size_t nobj, 
FILE *restrict fp); 
<stdio.h> p. 156 
返回 值 : 读 的 对 象 数 
free(void *ptr); 
<stdlib.h> p. 207 


freeaddrinfo(struct addrinfo *ai); 
«sys/socket.h» p. 599 
«netdb.h» 


*freopen (const char *restrict path, const char *restrict fype, FILE *restrict fp); 
<stdio.h> p. 148 
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int 


int 


int 


int 


int 


int 


int 


long 


off 七 


key t 


int 


int 


void 


int 


int 





type: "y". "W", "a", "r+", Map, "a+" 


返回 值 : 车 成 功 ， 返 回 文件 指针 ， 若 出 错 ， 返 回 NULL 


fscanf(FILE *restrict fp, const char *restrict format, ...); 


<stdio.h> p. 


162 


返回 值 ， 赋值 的 输入 项 数 ， 若 输入 出 错 或 在 任 一 转换 前 已 到 达 文件 尾 端 ， 返 回 EOF 


fseek(FILE *fp, long offset, int whence) ; 


<stdio.h> P. 


whence: SEEK SET. SEEK CUR. SEEK END 
BE: ARH, BEO 若 出 错 ， 返 回 -1 


fseeko (FILE *fp, off_t offset, int whence) ; 


<stdio.h> p. 


whence: SEEK SET. SEEK CUR. SEEK END 
返回 值 ， 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


fsetpos(FILE *fp, const fpos_t *pos) ; 


<stdio.h> p. 


返回 值 ， 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 非 0 


fstat(int fd, struct stat *buf); 


«sys/stat.h» P. 


返回 值 ; 车 成 功 ， 返 回 0; 若 出 错 ， 返 回 非 -1 


fstatat(int fd, const char *restrict path, 
struct stat *restrict buf, int flag); 


<sys/stat.h> p. 


flag: AT SYMLINK NOFOLLOW 
返回 值 : 车 成 功 ， 返 回 0; 车 出 错 ， 返 回 -1 


fsync(int fd); 


<unistd.h> p. 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 则 返回 -1 
ftell(FILE *fp); 


<stdio.h> p. 


返回 值 : 若 成 功 ， 返 回 当前 文件 位 置 指示 器 ; 若 出 错 ， 返 回 -1L 


ftello(FILE *fp); 


<stdio.h> p. 


返回 值 : 车 成 功 ， 返 回 当前 文件 位 置 指 示 器 ; 若 出 错 ， 返 回 (off_t)-1 


Etok (const char *path, int id); 


«sys/ipc.h» p. 


返回 值 : 若 成 功 ， 返 回 键 ， 若 出 错 ， 返 回 (key_t) -1 


ftruncate(int fd, off t length); 


«unistd.h» P. 


返回 值 ， 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


ftrylockfile(FILE *fp); 


<stdio.h> p. 


返回 值 : 若 成 功 ， 返 回 0， 若 不 能 获取 锁 ， 返 回 非 0 数值 


funlockfile(FILE *fp); 


<stdio.h> p. 


futimens(int fd, const struct timespec ftimes[2]); 


<sys/stat.h> P. 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


fwide(FILE *fp, int mode); 


158 


158 


158 


93 


93 


81 


158 


158 


557 


172 


443 


126 
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<stdio.h> p. 144 
<wchar.h> 


返回 值 : AVERY, BEEE: 车 流 是 字 节 定 向 的 ， 返 回 负 值 ， 若 流 是 


未 定向 的 ， 返 回 0 
size_t fwrite(const void *restrict ptr, size_t size, size_t nobj, 
FILE *restrict fp); 
<stdio.h> p. 156 
返回 值 ， 写 的 对 象 数 
const 
char *gai_strerror(int error); 
<netdb.h> p. 600 
返回 值 : 指向 描述 错误 的 字符 串 的 指针 
int getaddrinfo(const char *restrict host, const char *restrict service, 
const struct addrinfo *restrict hint, 
struct addrinfo **restrict res); 
<sys/socket.h> p. 599 
<netdb.h> 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 非 0 错误 码 
int getc(FILE *fp); 
«stdio.h» p. 150 
返回 值 ， 若 成 功 ， 返 回 下 一 个 字符 ， 若 已 到 达 文 件 尾 端 或 出 错 ， 返 回 EOF 
int getchar (void) ; 
<stdio.h> p. 150 
返回 值 : 若 成 功 ， 返 回 下 一 个 字符 ; 若 已 到 达 文 件 尾 端 或 出 错 ， 返 回 EOF 
int getchar_unlocked (void) ; 
<stdio.h> p. 444 
返回 值 : 若 成 功 ， 返 回 下 一 个 字符 ; 若 已 到 达 文 件 尾 或 者 出 错 ， 返 回 EOF 
int getc_unlocked (FILE *fp); 
<stdio.h> p. 444 
返回 值 ， 若 成 功 ， 返 回 下 一 个 字符 ; 车 已 到 达 文 件 尾 或 者 出 错 ， 返 回 EOF 
char *getcwd(char *buf, size_t size); 
<unistd.h> p. 136 
返回 值 : 若 成 功 ， 返 回 buf， 若 出 错 ， 返 回 NULL 
gid_t getegid (void) ; 
<unistd.h> p. 228 
返回 值 : 调用 进程 的 有 效 组 ID 
char *getenv(const char *name) ; 
<stdlib.h> p. 210 
返回 值 : 指向 与 name 关联 的 value 的 指针 ; 若 未 找到 ， 返 回 NULL 
uid_t geteuid (void) ; 
<unistd.h> p. 228 
返回 值 ， 调 用 进程 的 有 效用 户 ID 
gid_t getgid (void); 
<unistd.h> p.228 
返回 值 : 调用 进程 的 实际 组 ID 
struct 
group *getgrent (void) ; 


<grp.h> p. 183 
返回 值 ， 若 成 功 ， 返 回 指针 ; 若 出 错 或 到 达 文 件 尾 端 ， 返 回 NULL 
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struct 
group *getgrgid(gid t gid); 
<grp.h> p. 182 
返回 值 : 若 成 功 ， 返 回 指针 ; 若 出 错 ， 返 回 NULL 
struct 
group *getgrnam(const char *name); 
«grp.h» p.182 
返回 值 : 若 成 功 ， 返 回 指针 ;， dd. JBI] NULL 
int getgroups (int gidsetsize, gid t grouplist(]) ; 
«unistd.h» p. 184 
返回 值 : 若 成 功 ， 返 回 附属 组 ID 数量 ， 若 出 错 ， 返 回 -1 
struct 
hostent *gethostent (void); 
<netdb.h> p. 597 
返回 值 : 若 成 功 ， 返 回 指针 ; 若 出 错 ， 返 回 NULL 
int gethostname (char *name, int namelen) ; 
<unistd.h> p. 188 
返回 值 ， 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 
char *getlogin (void); 
<unistd.h> p. 275 
[857] 返回 值 ， 若 成 功 ， 返 回 指向 登录 名 字符 串 的 指针 ; 若 出 错 ， 返 回 NULL 
int getnameinfo(const struct sockaddr *restrict addr, 
socklen_t alen, char *restrict host, 
socklen_t hostlen, char *restrict service, 
socklen t servlen, unsigned int flags); 
<sys/socket.h> p. 600 
<netdb.h> 
flags: NI DGRAM. NI_NAMEREQD, NI NOFQDN. 
NI NUMERICHOST. NI NUMERICSCOPE. 
NI NUMERICSERV 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 非 0 值 
struct 
netent *getnetbyaddr(uint32 t met, int type); 
«netdb.h» p. 598 
返回 值 : 若 成 功 ， 返 回 指针 ， 若 出 错 ， 返 回 NULL 
struct 
netent *getnetbyname (const char *name) ; 
<netdb.h> p. 598 
返回 值 : 车 成 功 ， 返 回 指针 ， 若 出 错 ， 返 回 NULL 
struct 
netent *getnetent (void); 
<netdb.h> p. 598 
返回 值 : 车 成 功 ， 返 回 指针 ， 若 出 错 ， 返 回 NULL 
int getopt (int argc, char * const argv[], const char *options) ; 
«fcntl.h» p. 662 


extern int opterr, optind, optopt; 
extern char *optarg; 


EMA: 下 一 个 选项 字符 ; 若 所 有 选项 被 处 理 完 ， 返 回 -1 


int getpeername (int sockfd, struct sockaddr *restrict addr, 
socklen t *restrict alenp) ; 
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<sys/socket.h> p. 605 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 

pid_t getpgid(pid_t pid); 
<unistd.h> p. 294 
返回 值 : 若 成 功 ， 返 回 进程 组 ID; 若 出 错 ， 返 回 -1 

pid_t getpgrp (void); 
<unistd.h> p. 293 
返回 值 : 调用 进程 的 进程 组 ID 

pid_t getpid (void); 
<unistd.h> p. 228 
返回 值 : 调用 进程 的 进程 ID 

pid t getppid (void); 
«unistd.h» p. 228 
返回 值 : 调用 进程 的 父 进 程 ID 

int getpriority (int which, id t who); 
<sys/resource.h> p. 277 


which: PRIO PROCESS. PRIO PGRP. PRIO USER 
返回 值 ， 若 成 功 ， 返 回 -NZERO~NZERO-1 的 nice 值 ， 若 出 错 ， 返 回 -1 


struct 

protoent *getprotobyname (const char *name); 
«netdb.h» p.598 
返回 值 : 若 成 功 ， 返 回 指针 ;车 出 错 ， 返 回 NULL 

struct 

protoent *getprotobynumber (int proto); 
<netdb.h> p. 598 
返回 值 : 若 成 功 ， 返 回 指针 ; 若 出 错 ， 返 回 NULL 

struct 

protoent *getprotoent (void); 
<netdb.h> p. 598 
返回 值 : 若 成 功 ， 返 回 指针 ， 若 出 错 ， 返 回 NULL 

struct 

passwd *getpwent (void) ; 
<pwd.h> p. 180 
返回 值 : 车 成 功 ， 返 回 指针 ; 若 出 错 或 到 达 文 件 尾 端 ， 返 回 NULL 

struct 

passwd *getpwnam(const char *name); 
<pwd.h> p. 179 
返回 值 ， 若 成 功 ， 返 回 指针 ; 若 出 错 ， 返 回 NULL 

struct 

passwd *getpwuid(uid_t wid); 
<pwd.h> p.179 
返回 值 ， 车 成 功 ， 返 回 指针 ; 若 出 错 ， 返 回 NULL 

int getrlimit(int resource, struct rlimit *rlptr); 
<sys/resource.h> p. 220 


resource: RLIMIT_CORE, RLIMIT_CPU, 
RLIMIT_DATA, RLIMIT_FSIZE, 
RLIMIT_NOFILE, RLIMIT_STACK, 
RLIMIT_AS (FreeBSD 8.0. Linux 3.2.0. 
Solaris 10) , 
RLIMIT MEMLOCK (FreeBSD 8.0. Linux 3.2.0. 
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char 


struct 
servent 


struct 
servent 


struct 
servent 


pid_t 


int 


int 


struct 
spwd 


struct 
spwd 


int 


Mac OS X 10.6.8) , 
RLIMIT MSGQUEUE (Linux 3.2.0) , 
RLIMIT NICE (Linux3.2.0) , 
RLIMIT NPROC (FreeBSD 8.0, Linux 3.2.0, 
MacOS X 10.6.8) , 
RLIMIT NPTS (FreeBSD 8.0) , 
RLIMIT RSS (FreeBSD 8.0. Linux 3.2.0, 
MacOS X 10.6.8) , 

RLIMIT SBSIZE (FreeBSD 8.0) , 
RLIMIT SIGPENDING (Linux3.2.0) , 
RLIMIT SWAP (FreeBSD 8.0) , 
RLIMIT_VMEM (Solaris 10) 

返回 值 ， 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


*gets(char *buf); 
«stdio.h» 


BE: FRH, BE buf: 若 已 到 达 文 件 尾 端 或 出 错 ， 返 回 NULL 


*getservbyname (const char *name, const char *proto); 
<netdb.h> 
BMA: 若 成 功 ， 返 回 指针 ， 若 出 错 ， 返 回 NULL 


*getservbyport(int port, const char *proto) ; 
<netdb.h> 
返回 值 : 若 成 功 ， 返 回 指针 ， 若 出 错 ， 返 回 NULL 


*getservent (void); 
<netdb.h> 
返回 值 : 若 成 功 ， 返 回 指针 ， 苦 出错， 返回 NULL 


getsid(pid t pid); 
«unistd.h» 


返回 值 : 若 成 功 ， 返 回 会 话 首 进程 的 进程 组 ID; 若 出 错 ， 返 回 -1 


getsockname (int sockfd, struct sockaddr *restrict addr, 
Socklen t *restrict alenp); 
«sys/socket.h» 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


getsockopt (int sockfd, int level, int option, void *restrict val, 
socklen t *restrict lenp); 
«sys/socket.h» 


返回 值 : 若 成 功 ， 返 回 0; Fe, ge- 


*getspent (void) ; 
<shadow.h> 
返回 值 : 若 成 功 ， 返 回 指针 ; 若 出 错 ， 返 回 NULL 
平台 : Linux 3.2.0, Solaris 10 


*getspnam(const char *name); 
<shadow.h> 
返回 值 ， 若 成 功 ， 返 回 指针 ; 若 出 错 ， 返 回 NULL 
平台 : Linux 3.2.0、Solaris 10 


gettimeofday (struct timeval *restrict lp, 
void *restrict tp); 





p. 152 


p. 599 


p. 599 


p. 599 


p. 296 


p. 605 


p. 624 


p. 182 


p. 182 
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struct 
tm 
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uint32 t 


uintl6 t 


const 
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int 


int 


int 


int 


int 


int 


int 


int 
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<sys/time.h> 


返回 值 : 总 是 返回 0 


getuid (void); 
<unistd.h> 


返回 值 : 调用 进程 的 实际 用 户 ID 


*gmtime(const time t *calptr) ; 
<time.h> f 


返回 值 : 指向 分 解 的 tm 结构 的 指针 ， 若 出 错 ， 返 回 NULL 


grantpt(int fd); 
<stdlib.h> 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


htonl(uint32 t hostint32) ; 
<arpa/inet.h> 


返回 值 ， 以 网 络 字 节 序 表示 的 32 位 整数 


htons (uint16 t hostint16); 
<arpa/inet.h> 


返回 值 : 以 网 络 字 节 序 表示 的 16 位 整数 


*inet_ntop(int domain, const void *restrict addr, 
char *restrict str, socklen_t size); 
<arpa/inet.h> 


返回 值 : 若 成 功 ， 返 回 地 址 字符 串 指针 ， 若 出 错 ， 返 回 NULL 


inet pton(int domain, const char *restrict str, 
void *restrict addr); 
<arpa/inet.h> 


返回 值 : 若 成 功 ， 返 回 1; 若 格式 无 效 ， 返 回 0; 若 出 错 ， 返 回 -1 


initgroups(const char *username, gid_t basegid) ; 
<grp.h> /* Linux & Solaris */ 
<unistd.h> /* FreeBSD & Mac OS X */ 
返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 


ioctl(int fd, int request, ...); 
«unistd.h» /* System V */ 
<sys/ioctl.h> /* BSD and Linux */ 


返回 值 : 若 出 错 ， 返 回 -1;， 车 成 功 ， 返 回 其 他 值 


isatty(int fd); 
<unistd.h> 


返回 值 : 若 为 终端 设备 ， 返 回 1 GO): 否则 ， 返 回 0 ( 假 ) 


kill(pid t pid, int signo); 
<signal.h> 


返回 值 : 车 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


lchown (Const char *path, uid_t owner, gid_t group); 
<unistd.h> : 


返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 


link(const char *existingpath, const char *newpath) ; 
<unistd.h> 


返回 值 : 车 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


linkat(int efd, const char *existingpath, int nfd, 
const char *newpath, int flag); 


p. 190 


p.228 


p.192 


p.723 


p. 594 


p.594 


p. 596 


p. 596 


p.184 


p. 695 


p. 337 


p. 109 
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int 


int 


struct 
tm 


void 


off t 


int 


void 


int 


int 


char 


int 


int 


<unistd.h> 
flag: AT SYMLINK NOFOLLOW 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


lio listio(int mode, struct aiocb *restrict const list[restrict], 


int nent, struct sigevent *restrict sigev); 
<aio.h> 
mode: LIO NOWAIT. LIO WAIT 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


listen(int sockfd, int backlog) ; 
<sys/socket.h> 


返回 值 : FRH, lO; 若 出 错 ， 返 回 --1 


*localtime(const time 七 *calptr); 
<time.h> 


返回 值 ， 指 向 分 解 的 tm 结构 的 指针 ;车 出 错 ， 返 回 NULL 


longjmp(jmp buf env, int val); 
<setjmp.h> 


这 个 函数 不 返回 


lseek(int fd, off t offset, int whence); 
<unistd.h> 
whence: SEEK SET. SEEK CUR. SEEK END 
返回 值 : 若 成 功 ， 返 回 新 的 文件 偏 移 量 ， 若 出 错 ， 返 回 -! 


lstat(const char *restrict path, struct stat *restrict buf); 
<sys/stat.h> 


返回 值 ， 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 


*malloc (size t size); 
<stdlib.h> 
返回 值 ， 若 成 功 ， 返 回 非 空 指针 ; 若 出 错 ， 返 回 NULL 


mkdir(const char *path, mode_t mode); 
<sys/stat.h> 
mode: S IS[UG]ID. S_ISVTX, 
S I[RWX] (USRIGRP|OTH) 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


mkdirat(int fd, const char *path, mode_t mode) ; 
<sys/stat.h> 
mode: S IS(UG]ID. S_ISVTX, 
S I[RWX] (USR|GRP|OTH) 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


*mkdtemp (char *femplate) ; 
<stdlib.h> 
返回 值 : 若 成 功 ， 返 回 指向 目录 名 的 指针 ;， 若 出 错 ， 返 回 NULL 


mkfifo(const char *path, mode t mode); 
<sys/stat.h> 
mode: S IS[UG] ID. S_ISVTX, 
S I[RWX] (USR|GRP|OTH) 
返回 值 ， 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


mkfifoat(int fd, const char *path, mode_t mode); 
<sys/stat.h> 
mode: S_IS[UG]ID. S ISVTX. 
S I[RWX] (USR|GRP|OTH) 
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uint32 t 
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返回 值 : 若 成 功 ， 返 回 0: 若 出 错 ， 返 回 -1 


mkstemp (char *femplate) ; 
<stdlib.h> 
返回 值 : 若 成 功 ， 返 回 文件 描述 符 ; 若 出 错 ， 返 回 -1 


mktime (struct tm *tfmptr); 
«time.h» 


返回 值 : 若 成 功 ， 返 回 日 历时 间 : 若 出 错 ， 返 回 -1 


*mmap (void *addr, size_t len, int prot, int flag, int fd, 
off_t off); 
<sys/mman.h> 
prot: PROT READ. PROT WRITE. PROT EXEC. PROT NONE 
flag: MAP FIXED. MAP SHARED. MAP PRIVATE 
返回 值 : 若 成 功 ， 返 回 映射 区 的 起 始 地 址 ; 若 出 错 ， 返 回 MAP FAILED 


mprotect (void *addr, size t len, int prot); 
<sys/mman.h> 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 
msgctl(int msqid, int cmd, struct msqid ds *buf); 
<sys/msg.h> 
cmd: IPC STAT. IPC SET. IPC RMID 
返回 值 : 车 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 


msgget(key t key, int flag); 
«sys/msg.h» 
flag: IPC CREAT. IPC EXCL 
返回 值 : 若 成 功 ， 返 回 消息 队列 ID: 若 出 错 ， 返 回 -1 


msgrev(int msqid, void *ptr, size t nbytes, long type, int flag); 
<sys/msg.h> 
flag: IPC NOWAIT. MSG NOERROR 
返回 值 : 若 成 功 ， 返 回 消息 数据 部 分 的 长 度 ， 若 出 错 ， 返 回 -1 


msgsnd(int msqid, const void *ptr, size t nbytes, int flag); 
<sys/msg.h> 
flag: IPC_NOWAIT 
返回 值 ， 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 


msync (void *addr, size_t len, int flags); 
<sys/mman.h> 
flag: MS ASYNC. MS INVALIDATE. MS SYNC 
返回 值 : 者 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


munmap (void *addr, size_t len); 
<sys/mman.h> 


BEW: 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


nanosleep(const struct timespec *reqtp, 
struct timespec *remtp) ; 
<time.h> 


返回 值 : 若 休眠 够 要 求 的 时 间 ， 返 回 0， 若 出 错 ， 返 回 -1 


nice(int incr); 
<unistd.h> 


返回 值 : 若 成 功 ， 返 回 新 的 nice 值 减 掉 NzERO; 若 出 错 ， 返 回 -1 


ntohl(uint32 t netint32) ; 
<arpa/inet.h> 


返回 值 : 以 主机 字 节 序 表示 的 32 位 整数 
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int 


DIR 


void 


FILE 


FILE 


long 





ntohs (uint16_t netintl6) ; 


<arpa/inet.h> p. 594 
返回 值 : 以 主机 字 节 序 表 示 的 16 位 整数 
open(const char *path, int oflag, ... /* mode t mode */ ); 
«fcntl.h» p. 62 
oflag: O RDONLY. O WRONLY. O_RDWR. O EXEC. 
O, SEARCH; 


O APPEND. O CLOEXEC. O CREAT. 
O DIRECTORY. O_DSYNC, O EXCL. 
O NOCTTY. O NOFOLLOW. O NONBLOCK, 
O RSYNC. O SYNC. O TRUNC. O TTY INIT 
mode: S IS[UG]ID. S ISVTX. 
S I[RWX] (USRIGRP1OTH) 
返回 值 : 若 成 功 ， 返 回 文件 描述 符 ; 若 出 错 ， 返 回 -1 
平台 : 在 FreeBSD 8.0 和 Mac OS X 10.6.8 中 还 有 一 个 O_FSYNC 标志 


openat(int fd, const char *path, int oflag, 
/* mode_t mode */ ); 
«fcntl.h» p. 62 
oflag: O RDONLY. O WRONLY. O_RDWR, O EXEC. 
O SEARCH; 
O APPEND. O CLOEXEC. O CREAT. 
O DIRECTORY. O_DSYNC, O_EXCL, 
O NOCTTY. O NOFOLLOW. O NONBLOCK. 
O RSYNC. O SYNC, O_TRUNC, O TTY INIT 
mode: S IS[UG]ID. S ISVTX, 
S I[RWX] (USR |GRP | OTH) 
返回 值 : 若 成 功 ， 返 回 文件 描述 符 ; 若 出 错 ， 返 回 -1 
平台 : 在 FreeBSD 8.0 和 Mac OS X 10.6.8 中 还 有 一 个 O_FSYNC 标志 


*opendir(const char *path) ; 
<dirent.h> p. 130 
返回 值 : 若 成 功 ， 返 回 指针 ; 若 出 错 ， 返 回 NULL 


openlog(const char *ident, int option, int facility) ; 
<syslog.h> p. 470 
option: LOG CONS. LOG NDELAY. LOG NOWAIT. 
LOG ODELAY. LOG PERROR、 LOG PID 
facility: LOG AUTH. LOG AUTHPRIV. LOG CRON, 
LOG DAEMON. LOG FTP. LOG KERN. 
LOG LOCAL[0-7]. LOG LPR. LOG MAIL. 
LOG NEWS. LOG SYSLOG. LOG USER. LOG UUCP 


*open memstream(char **bufp, size t *sizep); 
<stdio.h> p. 173 
返回 值 : 车 成 功 ， 返 回流 指针 ; 若 出 错 ， 返 回 NULL 


*open wmemstream(wchar t **bufp, size t *sizep); 
<wchar.h> p. 173 
返回 值 : 若 成 功 ， 返 回流 指针 ; 若 出 错 ， 返 回 NULL 


pathconf(const char *path, int name); 
«unistd.h» p.42 
name: PC ASYNC IO. PC CHOWN RESTRICTED. 
.PC FILESIZEBITS. PC LINK MAX. 
.PC MAX CANON. PC MAX INPUT. 
.PC, NAME MAX. PC NO TRUNC. PC PATH MAX, 
.PC PIPE BUF. PC PRIO IO. PC SYMLINK MAX, 


int 


int 


void 


int 


int 


FILE 


int 


ssize t 


int 


int 


void 


void 


int 


int 


pause (void); 


pclose (FILE 


perror (const 
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_PC_SYNC_IO, _PC_TIMESTAMP_RESOLUTION, 
_PC_2_SYMLINKS, _PC_VDISABLE 
返回 值 ， 若 成 功 ， 返 回 相应 值 ， 若 出 错 ， 返 回 -1 


<unistd.h> p. 338 
返回 值 : -1，erzrno REX EINTR 

*fp: 
<stdio.h> p. 541 


返回 值 ， 若 成 功 ， 返 回 popen 函数 中 emdstring 的 终止 状态 ， 若 出 错 ， 返 回 -1 


char *msg); 
<stdio.h> p. 15 


pipe(int fd[2]); 


<unistd.h> p. 535 
返回 值 : 车 成 功 ， 返 回 0; 车 出 错 ， 返 回 -1 


poll(struct pollfd fdarray[], nfds t nfds, int timeout); 


*popen (const 


posix openpt 


pread(int fd, 


printf (const 


<poll.h> p. 506 
返回 值 : 准备 就 绪 的 描述 符 数 ， 若 超时 ， 返 回 0; 若 出 错 ， 返 回 -1 


char *cmdstring, const char *type); 

<stdio.h> p. 541 
type: "r", "w" 

返回 值 : 若 成 功 ， 返 回 文件 指针 ; 若 出 错 ， 返 回 NULL 

(int oflag) ; 

«stdlib.h» p. 722 
«fcntl.h» 


oflag: O RWDR. O NOCTTY 
返回 值 : 若 成 功 ， 返 回 下 一 个 可 用 的 PTY 主 设备 文件 描述 符 ， 若 出 错 ， 返 回 -1 


void *buf, size_t nbytes, off_t offset); 


<unistd.h> p. 78 
返回 值 : 读 到 的 字 节 数 ， 若 已 到 达 文 件 尾 端 ， 返 回 0， 若 出 错 ， 返 回 -1 

char *restrict format, ...); 

<stdio.h> p. 159 


返回 值 : 若 成 功 ， 返 回答 出 字符 数 ， 若 输出 出 错 ， 返 回 负 值 


pselect(int maxfdpl, fd set *restrict readfds, 
fd set *restrict writefds, fd set *restrict exceptfds, 
const struct timespec *restrict tsptr, 
const sigset t *restrict sigmask); 


<sys/select.h> p. 506 
返回 值 : 准备 就 绪 的 描述 符 数 ， 若 超时 ， 返 回 0， 若 出 错 ， 返 回 -1 


psiginfo(const siginfo t *info, const char *msg) ; 


<signal.h> p. 379 


psignal (int signo, const char *msg); 


<signal.h> p. 379 
<siginfo.h> /* on Solaris */ 


pthread atfork(void (*prepare) (void), void (*parent) (void), 


void (*child) (void) ); 
<pthread.h> p. 458 
返回 值 : 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


pthread_attr_destroy(pthread_attr_t *atfr); 


<pthread.h> p. 427 
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int 


int 


int 


int 


int 


int 


int 


int 


int 


int 


int 


int 





返回 值 : FRH, WO; AM, RSS 


pthread attr getdetachstate(const pthread attr t *attr, 
int *detachstate) ; 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


pthread attr getguardsize(const pthread attr t 
*restrict attr, 
size t *restrict guardsize); 
<pthread.h> 
返回 值 : FRH, EO; AM, BERS 


pthread_attr_getstack (const pthread attr t *restrict attr, 
void **restrict stackaddr, 
size_t *restrict stacksize) ; 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 
pthread_attr_getstacksize(const pthread_attr_t 
*restrict attr, 
size t *restrict stacksize) ; 
«pthread.h» 


返回 值 : 若 成 功 ， 返 回 0， 和 否则 ， 返 回 错误 编号 


pthread attr init(pthread attr t *attr); 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


pthread attr setdetachstate(pthread attr t *attr, 
int detachstate) ; 
«pthread.h» 
detachstate: PTHREAD CREATE DETACHED. 
PTHREAD CREATE JOINABLE 
返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


pthread attr setguardsize(pthread attr t *attr, 
size t guardsize) ; 
<pthread.h> 
返回 值 ， 若 成 功 ， 返 回 0， 否 则 ， 返 回 错 误 编号 


pthread attr setstack(const pthread attr t *affr, 
void *stackaddr, size t *stacksize) ; 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0， 和 否则 ， 返 回 错误 编号 


pthread attr setstacksize(pthread attr t *attr, 
size t stacksize) ; 
<pthread.h> 
返回 值 : RD). EO; 和 否则， 返回 错误 编号 


pthread barrierattr destroy(pthread barrierattr t *aftr) ; 
<pthread.h> 


返回 值 : 车 成 功 ， 返 回 0， 否则， 返回 错误 编号 


pthread barrierattr getpshared(const pthread barrierattr t 
*restrict attr, 
int *restrict pshared); 
«pthread.h» 
返回 值 : 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


pthread barrierattr init(pthread barrierattr t *attr); 


p.428 


p. 430 


p. 429 


p. 430 


p. 427 


p. 428 


p. 430 


p. 429 


p. 430 


p. 441 


p. 441 


int 


int 


int 


int 


int 


Void 


void 


int 


int 


int 


int 


int 


int 
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<pthread.h> p. 441 
返回 值 : 若 成 功 ， 返 回 0;， 否则 ， 返 回 错误 编号 


pthread barrierattr setpshared(pthread barrierattr t *attr, 
int pshared) ; 
<pthread.h> p. 441 
pshared: PTHREAD PROCESS PRIVATE. 
PTHREAD PROCESS SHARED 
返回 值 ， 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


pthread barrier destroy (pthread barrier t *barrier); 
<pthread.h> p. 418 
返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


pthread barrier init(pthread barrier t *restrict barrier, 
constpthread barrierattr t 
*restrict attr, 
unsigned int count); 
«pthread.h» p.418 
EMA: 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


pthread barrier wait(pthread barrier t *barrier); 
<pthread.h> p. 419 
返回 值 : 若 成 功 ， 返 回 0 或 者 PTHREAD BARRIER SERIAL THREAD; 
否则 ， 返 回 错误 编号 


pthread_cancel (pthread_t fid) ; 
<pthread.h> p. 393 
返回 值 : Ak, lO; 和 否则， 返回 错误 编号 


pthread_cleanup_pop(int execute) ; 
<pthread.h> p. 394 


pthread cleanup push(void (*rtn) (void *), void *arg); 
<pthread.h> p. 394 


pthread_condattr_destroy(pthread_condattr_t *attr); 
<pthread.h> p. 440 
返回 值 : 若 成 功 ， 返 回 0; 否则， 返回 错误 编号 


pthread condattr getclock(const pthread condattr t 
*restrict attr, 
clockid t *restrict clock id); 
<pthread.h> p. 441 
返回 值 ， 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


pthread condattr getpshared(const pthread condattr t 
*restrict attr, 
int *restrict pshared) ; 
<pthread.h> p. 440 
返回 值 : 车 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 
pthread condattr init(pthread condattr t *attr) 7 


<pthread.h> p. 440 
返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


pthread condattr setclock(pthread condattr t *atrr, 
clockid t clock id) ; 
<pthread.h> p. 441 
返回 值 : 车 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


pthread_condattr_setpshared (pthread condattr t *attr, 
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int 


int 


int 


int 


int 


int 


int 


int 


int 


void 


void 


int 


int 





int pshared) ; 
<pthread.h> 
pshared: PTHREAD PROCESS PRIVATE. 
PTHREAD PROCESS SHARED 
返回 值 : 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


pthread cond broadcast(pthread cond t *cond) ; 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


pthread cond destroy (pthread cond t *cond); 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0， 否 则 ， 返 回 错误 编号 


pthread_cond_init (pthread_cond_t *restrict cond, 


const pthread_condattr_t *restrict attr); 


<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0;， 否则 ， 返 回 错误 编号 


pthread_cond_signal (pthread_cond_t *cond) ; 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


pthread cond timedwait(pthread cond t *restrict cond, 
pthread mutex t *restrict mutex, 


const struct timespec 
*restrict timeout); 
<pthread.h> 


返回 值 : 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


pthread cond wait(pthread cond t *restrict cond, 


pthread mutex t *restrict mutex); 


<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


pthread create(pthread t *restrict fidp, 
const pthread attr t *restrict attr, 
void *(*start rtn) (void *), 
void *restrict arg); 
<pthread.h> 
返回 值 ， 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


pthread detach (pthread t tid); 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0， 否则， 返回 错误 编号 


pthread_equal (pthread t tidl, pthread t tid2); 
<pthread.h> 


返回 值 : 若 相等 ， 返 回 非 0 数值， 否则， 返回 0 


pthread_exit (void *rval ptr); 
<pthread.h> 


*pthread getspecific(pthread key t key); 
<pthread.h> 


返回 值 : 线程 特定 数据 值 ， 若 没有 值 与 该 键 关 联 ， 返 回 NULL 


pthread join(pthread t thread, void **rval ptr) ; 
«pthread.h» 


返回 值 ， 若 成 功 ， 返 回 0， 和 否则， 返回 错误 编号 


pthread key create (pthread key t *keyp, 


p. 440 


p. 415 


p.414 


p.414 


p.415 


p.414 


p.414 


p.385 


p. 397 


p.385 


p. 389 


p. 449 


p.389 


int 


int 


int 


int 


int 


int 


int 


int 


int 


int 


int 
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void (*destructor) (void *)); 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


pthread key delete(pthread key t key); 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0: 否则 ， 返 回 错误 编号 


pthread_kill(pthread_t thread, int signo) ; 
<signal.h> 


返回 值 : 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


pthread mutexattr destroy (pthread_mutexattr_t *attr); 
<pthread.h> 
返回 值 ， 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


pthread mutexattr getpshared(const pthread mutexattr t 
*restrict attr, 
int *restrict pshared); 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


pthread mutexattr getrobust(const pthread mutexattr t 
*restrict attr, 
int *restrict robust); 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 
pthread mutexattr gettype(const pthread mutexattr t 
*restrict attr, 
int *restrict type); 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


pthread mutexattr init(pthread mutexattr t *attr); 
«pthread.h» 
返回 值 : 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


pthread mutexattr setpshared(pthread mutexattr t *attr, 
int pshared) ; 
<pthread.h> 
pshared: PTHREAD PROCESS PRIVATE, 
PTHREAD PROCESS SHARED 
返回 值 ， 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


pthread mutexattr setrobust(pthread mutexattr t *attr, 
int robust); 
«pthread.h» 
robust: PTHREAD MUTEX ROBUST. 
PTHREAD MUTEX STALLED 
返回 值 : 若 成 功 ， 返 回 o. 和 否则， 返回 错误 编号 


函数 原型 705 


p. 447 


p. 448 


p. 455 


p. 431 


p. 431 


p. 432 


p. 434 


p. 431 


p. 431 


p. 432 


pthread_mutexattr_settype (pthread mutexattr t *attr, int type); 


<pthread.h> 

type: PTHREAD MUTEX NORMAL, 
PTHREAD MUTEX ERRORCHECK. 
PTHREAD MUTEX RECURSIVE. 
PTHREAD MUTEX DEFAULT 

返回 值 : HA. BO: 否则 ， 返 回 错误 编号 


Pthread mutex consistent (pthread mutex 七 *mutex) ; 
<pthread.h> 


p. 434 


p. 433 
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int 


int 


int 


int 


int 


int 


int 


int 


int 


int 


int 


int 


int 


返回 值 : 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


pthread mutex destroy (pthread mutex t *mutex) ; 
<pthread.h> 
返回 值 ， 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


Pthread mutex init(pthread mutex t *restrict mutex, 
const pthread mutexattr t *restrict attr); 
«pthread.h» 
返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


pthread mutex lock(pthread mutex t *mutex) ; 
<pthread.h> 
返回 值 : Hk, EO; 否则 ， 返 回 错误 编号 


pthread mutex timedlock(pthread mutex t *restrict mutex, 
const struct timespec *restrict fsptr) ; 
<pthread.h> 
<time.h> 


返回 值 ， 若 成 功 则 ， 返 回 0; 否则 ， 返 回 错误 编号 


pthread mutex trylock(pthread mutex t *mutex); 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


pthread mutex unlock(pthread mutex t *mutex) ; 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


pthread once(pthread once t *initflag, void (*initfn) (void) ) 
<pthread.h> 
pthread once t initflag- PTHREAD_ONCE_INIT; 
返回 值 : 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


pthread rwlockattr destroy (pthread_rwlockattr_t *attr) ; 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


pthread_rwlockattr_getpshared(const pthread_rwlockattr_t 
*restrict attr, 
int *restrict pshared) ; 
<pthread.h> 
返回 值 : 老成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


pthread rwlockattr init(pthread rwlockattr t *attr) 7 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0;， 否则 ， 返 回 错误 编号 


pthread rwlockattr setpshared(pthread rwlockattr t *attr, 
int pshared) ; 
<pthread.h> 
pshared: PTHREAD PROCESS PRIVATE, 
PTHREAD PROCESS SHARED 
返回 值 : FRH, Eo 否则， 返回 错误 编号 


pthread_rwlock_destroy (pthread_rwlock_t *rwlock) ; 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


pthread rwlock init(pthread rwlock t *restrict rwlock, 
const pthread rwlockattr t 
*restrict attr) ; 
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p. 448 
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<pthread.h> 
返回 值 : 车 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


pthread rwlock rdlock(pthread rwlock t *rwlock) ; 
«pthread.h» 
返回 值 : 若 成 功 ， 返 回 0， 否则 ， 返 回 错误 编号 


pthread_rwlock_timedrdlock (pthread_rwlock_t *restrict rwlock, 
const struct timespec 
*restrict (sptr); 
<pthread.h> 
<time.h> 


返回 值 : FRH, BE: 和 否则， 返回 错误 编号 


pthread rwlock timedwrlock(pthread rwlock t *restrict rwlock, 
const struct timespec 
*restrict ftsptr); 
<pthread.h> 
<time.h> 


返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


pthread rwlock tryrdlock(pthread rwlock t *rwlock); 
<pthread.h> 
返回 值 : 车 成 功 ， 返 回 0， 否则， 返回 错误 编号 


pthread rwlock trywrlock(pthread rwlock t *rwlock); 
«pthread.h» 
返回 值 : 若 成 功 ， 返 回 0; 否则， 返回 错误 编号 


pthread rwlock unlock(pthread rwlock t *rwlock); 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


pthread rwlock wrlock(pthread rwlock t *rwlock); 
<pthread.h> 
返回 值 : FRH, EO; AM, BEARS 


pthread_self (void); 
<pthread.h> 
返回 值 : 调用 线程 的 线程 ID 


pthread setcancelstate(int state, int *oldstate) ; 
<pthread.h> 
state: PTHREAD CANCEL ENABLE, 
PTHREAD CANCEL DISABLE 
返回 值 : FRH., 80; 否则 ， 返 回 错误 编号 


pthread setcanceltype(int type, int *oldtype) ; 
<pthread.h> 
type: PTHREAD_CANCEL_DEFERRED, 
PTHREAD_CANCEL_ASYNCHRONOUS 
返回 值 : 若 成 功 ， 返 回 0; 否则 ， 返 回 错 误 编号 


pthread_setspecific(pthread_key_t key, const void *value) ; 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


pthread sigmask(int how, const sigset t *restrict set, 
sigset t *restrict oset); 
«signal.h» 
how: SIG BLOCK. SIG UNBLOCK. SIG SETMASK 
返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 





p. 409 
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p.410 
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p.410 
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int 


ssize t 


pthread spin destroy (pthread spinlock t *lock); 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 AU, BERRI 


pthread spin init(pthread spinlock t */ock, int pshared) ; 
<pthread.h> 
pshared: PTHREAD_PROCESS_PRIVATE, 
PTHREAD_PROCESS_SHARED 
返回 值 ， 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


pthread spin lock (pthread spinlock t */ock); 
«pthread.h» 
返回 值 ， 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


pthread spin trylock(pthread spinlock t *lock); 
<pthread.h> 
返回 值 : 车 成 功 ， 返 回 0， 和 否则， 返回 错误 编号 


pthread spin unlock(pthread spinlock t *lock) ; 
<pthread.h> 
返回 值 ， 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


pthread_testcancel (void) ; 
<pthread.h> 


*ptsname (int fd); 
<stdlib.h> 


MA: 若 成 功 ， 返 回 指向 PTY 从 设备 名 的 指针 ， 若 出 错 ， 返 回 NULL 


putc(int c, FILE *fp); 
<stdio.h> 


返回 值 : FRH, BE c; 若 出 错 ， 返 回 EOF 


putchar (int c); 
<stdio.h> 


WMA: 若 成 功 ， 返 回 c; 若 出 错 ， 返 回 BOF 


putchar unlocked(int c); 
<stdio.h> 


返回 值 : AAA. BE c; 若 出 错 ， 返 回 EOF 


putc unlocked(int c, FILE *fp); 
<stdio.h> 


返回 值 : FRH, Welle; 若 出 错 ， 返 回 BOF 


putenv(char *str); 
<stdlib.h> 
返回 值 : 车 成 功 ， 返 回 0; 若 出 错 ， 返 回 非 0 


puts (const char *str); 
<stdio.h> 


返回 值 : 若 成 功 ， 返 回 非 负 值 ， 若 出 错 ， 返 回 EOF 


pwrite(int fd, const void *buf, size_t nbytes, off_t offset); 
<unistd.h> 


返回 值 : 若 成 功 ， 返 回 已 写 的 字 节 数 ， 若 出 错 ， 返 回 -1 


raise(int signo); 
<signal.h> 


返回 值 : 车 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


read(int fd, void *buf, size t nbytes); 
«unistd.h» 


p.417 


p. 417 


p. 418 


p. 418 


p.418 


p. 453 


p. 723 


p. 152 


p. 152 


p. 444 


p. 444 


p.212 


p. 153 


p. 78 


p.337 


struct 
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返回 值 : 读 到 的 字 节 数 ， 若 已 到 达 文件 尾 端 ， 返 回 0; 若 出 错 ， 返 回 -1 


*readdir(DIR *dp); 
«dirent.h» p. 130 
返回 值 ， 若 成 功 ， 返 回 指针 ; 若 在 目录 尾 或 出 错 ， 返 回 NULL 


readlink(const char *restrict path, char *restrict buf, 
size_t bufsize) ; 
<unistd.h> p. 123 
返回 值 : 若 成 功 ， 返 回 读 取 的 字 节 数 ; 若 出 错 ， 返 回 -1 


readlinkat(int fd, const char* restrict path, 
char *restrict buf, size t bufsize) ; 
«unistd.h» p.123 
返回 值 ， 若 成 功 ， 返 回 读 取 的 字 节 数 ， 若 出 错 ， 返 回 -1 


readv (int fd, const struct iovec *iov, int iovcnt); 
<sys/uio.h> p. 521 
返回 值 ， 若 成 功 ， 返 回 已 读 的 字 节 数 ， 若 出 错 ， 返 回 -1 


*realloc(void *ptr, size t newsize) ; 
<stdlib.h> p. 207 
返回 值 ， 若 成 功 ， 返 回 非 空 指针 ; 若 出 错 ， 返 回 NULL 


recv (int sockfd, void *buf, size_t nbytes, int flags); 

<sys/socket.h> p. 612 
flags: MSG_PEEK, MSG_OOB, MSG_WAITALL, 

MSG_CMSG_CLOEXEC (Linux 3.2.0) , 

MSG DONTWAIT (FreeBSD 8.0, Linux 3.2.0. 

Solaris 10) , 

MSG_ERRQUEUE (Linux 3.2.0) , 

MSG_TRUNC (Linux 3.2.0) 
返回 值 : 数据 的 字 节 长 度 ; 若 无 可 用 数据 或 对 等 方 已 经 按 序 结束 ， 返 回 0; 

若 出 错 ， 返 回 -1 


recvfrom(int sockfd, void *restrict buf, size_t len, int flags, 
struct sockaddr *restrict addr, 
Socklen t *restrict addrlen) ; 
<sys/socket.h> p. 613 
flags: MSG_PEEK, MSG_OOB, MSG_WAITALL, 
MSG_CMSG_CLOEXEC (Linux 3.2.0) , 
MSG DONTWAIT (FreeBSD 8.0, Linux 3.2.0. 
Solaris 10) , 
MSG_ERRQUEUE (Linux 3.2.0) , 
MSG_TRUNC (Linux 3.2.0) 
返回 值 : 数据 的 字 节 长 度 ; 若 无 可 用 数据 或 对 等 方 已 经 按 序 结束 ， 返 回 0; 
若 出 错 ， 返 回 -1 


recvmsg(int sockfd, struct msghdr *msg, int flags); 
<sys/socket.h> p. 613 
flags: MSG_PEEK, MSG_OOB, MSG_WAITALL, 
MSG_CMSG_CLOEXEC (Linux 3.2.0) , 
MSG DONTWAIT (FreeBSD 8.0, Linux 3.2.0, 
Solaris 10) , 
MSG ERRQUEUE (Linux 3.2.0) , 
MSG TRUNC (Linux 3.2.0) 
返回 值 : 数据 的 字 节 长 度 ; 若 无 可 用 数据 或 对 等 方 已 经 按 序 结束 ， 返 回 0; 
若 出 错 ， 返 回 -1 
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int 


int 


int 


void 


void 


int 


int 


void 


int 


int 


int 


int 


int 


int 


int 





remove (const char *path) ; 
<stdio.h> p. 119 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


rename (const char *oldname, const char *mewname) ; 
<stdio.h> p. 119 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


renameat (int oldfd, const char *oldname, int newfd, 
const char *newname) ; 
<stdio.h> p. 119 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


rewind(FILE *fp); 


<stdio.h> p. 158 
rewinddir (DIR *dp) ; 

<dirent.h> p. 130 
rmdir(const char *path) ; 

<unistd.h> p. 130 

返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 
scanf(const char *restrict format, ...); 

<stdio.h> p. 162 


返回 值 : 赋值 的 输入 项 数 ， 若 输入 出 错 或 在 任 一 转换 前 已 到 达 文 件 尾 端 ， 返 回 EOF 


seekdir(DIR *dp, long loc); 
<dirent.h> p. 130 


select (int maxfdpl, fd set *restrict readfds, 
fd_set *restrict writefds, fd_set *restrict exceptfds, 
struct timeval *restrict fvwprr); 
<sys/select.h> p. 502 
返回 值 : 准备 就 绪 的 描述 符 数 ， 若 超时 ， 返 回 0; 若 出 错 ， 返 回 -1 


sem close(sem t *sem); 
<semaphore.h> p. 580 
返回 值 : 车 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


semctl (int semid, int semnum, int cmd, 
/* union semun arg */ ); 
<sys/sem.h> p. 567 
cmd: IPC STAT. IPC SET. IPC_RMID, GETPID, 
GETNCNT. GETZCNT. GETVAL. SETVAL. 
GETALL. SETALL 
EMA: 〈 返 回 值 取决 于 命令 ) ; 若 出 错 ， 返 回 --] 


sem destroy(sem t *sem) ; 
<semaphore.h> p. 582 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


semget (key t key, int nsems, int flag); 
<sys/sem.h> p. 567 
flag: IPC_CREAT, IPC EXCL 
返回 值 : 若 成 功 ， 返 回信 号 量 ID， 若 出 错 ， 返 回 -1 


sem getvalue(sem t *restrict sem, int *restrict valp); 
<semaphore.h> p. 582 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


sem_init(sem_t *sem, int pshared, unsigned int value) ; 
<semaphore.h> p. 582 


int 


sem_t 


int 


int 


int 


int 


int 


ssize t 


ssize t 


ssize t 
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返回 值 : FRH, Beo 若 出 错 ， 返 回 -1 


semop (int semid, struct sembuf semoparray[], size t nops); 
<sys/sem.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


*sem open(const char *name, int oflag, ... /* mode t mode, 
unsigned int value */ ); 
<semaphore.h> 
flag: IPC CREAT. IPC EXCL 
返回 值 : 若 成 功 ， 返 回 指向 信号 量 的 指针 若 出 错 ， 返 回 SEM FAILED 


sem_post(sem_t *sem); 
<semaphore.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


sem_timedwait(sem_t *restrict sem, 
const struct timespec *restrict ¢sptr) ; 
<semaphore.h> 
<time.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


sem trywait(sem t *sem); 
<semaphore.h> 


BEW: 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


sem_unlink(const char *name) ; 
<semaphore.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


sem wait(sem t *sem); 
<semaphore.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


send(int sockfd, const void *buf, size t nbytes, int flags); 
«sys/socket.h» 
flags: MSG EOR, MSG OOB, MSG NOSIGNAL, 
MSG CONFIRM (Linux 3.2.0) , 
MSG_DONTROUTE (FreeBSD 8.0, Linux 3.2.0, 
Mac OS X 10.6.8. Solaris 10) , 
MSG DONTWAIT (FreeBSD 8.0. Linux 3.2.0. 
Mac OS X 10.6.8. Solaris 10) , 
MSG EOF (FreeBSD 8.0. Mac OS X 10.6.8) , 
MSG MORE (Linux 3.2.0) 
返回 值 : 若 成 功 ， 返 回 发 送 的 字 节 数 ， 若 出 错 ， 返 回 -1 


sendmsg (int sockd, const struct msghdr *msg, int flags); 
<sys/socket.h> 
flags: MSG_EO, MSG_OOB, MSG_NOSIGNAL, 
MSG_CONFIRM (Linux 3.2.0) , 
MSG DONTROUTE (FreeBSD 8.0. Linux 3.2.0, Mac OS X 10.6.8. 
Solaris 10) , 
MSG DONTWAIT (FreeBSD 8.0. Linux 3.2.0. Mac OS X 10.6.8. 
Solaris 10) , 
MSG_EOF (FreeBSD 8.0. Mac OS X 10.6.8) , 
MSG_MORE (Linux 3.2.0) 
返回 值 : 若 成 功 ， 返 回 发 送 字 节 数 ， 若 出 错 ， 返 回 -1 


sendto (int sockfd, const void *buf, size_t nbytes, int flags, 
const struct sockaddr *destaddr, socklen_t destlen) ; 
<sys/socket.h> 


p. 568 


p. 579 


p. 582 


p. 581 


p. 581 


p. 580 


p. 581 


p.610 


p. 611 


p. 610 
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flags: MSG_EOR, MSG OOB, MSG NOSIGNAL, 
MSG CONFIRM (Linux3.2.0) , 
MSG DONTROUTE(FreeBSD 8.0, Linux 3.2.0, Mac OS X 10.6.8, Solaris 10), 
MSG DONTWAIT(FreeBSD 8.0, Linux 3.2.0. Mac OS X 10.6.8. Solaris 10), 
MSG EOF (FreeBSD 8.0, Mac OS X 10.6.8) , 
MSG_MORE (Linux 3.2.0) 

返回 值 : 若 成 功 ， 返 回 发 送 的 字 节 数 ， 若 出 错 ， 返 回 -1 


void setbuf (FILE *restrict fp, char *restrict buf); 
<stdio.h> p. 146 
int setegid(gid t gid); 
«unistd.h» p. 258 
返回 值 : 车 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 
int setenv (const char *nmame, const char *value, int rewrite); 
<stdlib.h> p. 212 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 
int seteuid(uid t uid); 
<unistd.h> p. 258 
返回 值 ， 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 
int setgid(gid t gid); 
<unistd.h> p. 256 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 
void setgrent (void); 
<grp.h> p. 183 
int setgroups (int ngroups, const gid t grouplist[]) ; 
<grp.h> /* Linux */ p. 184 


<unistd.h> /* FreeBSD, Mac OS X, and Solaris */ 
返回 值 ， 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


void sethostent(int stayopen) ; 


<netdb.h> p. 597 


int setjmp (jmp_buf env); 


<setjmp.h> p.215 
返回 值 : 若 直接 调用 ， 返 回 0; 若 从 longjmp 返回 ， 返 回 非 0 


int setlogmask (int maskpri) ; 


<syslog.h> p 470 
返回 值 : 前 日 志 记录 优先 级 屏蔽 字 值 


void setnetent (int stayopen) ; 


«netdb.h» p. 598 


int setpgid(pid t pid, pid t pgid) ; 


«unistd.h» p. 294 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 一 


int setpriority(int which, id_t who, int value); 


<sys/resource.h> p.277 
which: PRIO PROCESS. PRIO PGRP. PRIO USER 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


Void setprotoent (int stayopen) ; 

«netdb.h» p. 598 
void setpwent (void); 

<pwd.h> p. 180 
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int 
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int 
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setregid(gid_t rgid, gid_t egid); 
<unistd.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


setreuid(uid t ruid, uid t euid); 
«unistd.h» 


返回 值 : 若 成 功 ， 返 回 0; 车 出 错 ， 返 回 -1 


setrlimit(int resource, const struct rlimit *rlptr); 
<sys/resource.h> 


resource: 


RLIMIT_CORE, RLIMIT_CPU, 
RLIMIT_DATA, RLIMIT_FSIZE, 
RLIMIT NOFILE. RLIMIT STACK, 
RLIMIT AS (FreeBSD 8.0. Linux 3.2.0, 
Solaris 10) , 
RLIMIT MEMLOCK (FreeBSD 8.0. Linux 3.2.0. 
MacOS X 10.6.8) , 
RLIMIT MSGQUEUE (Linux 3.2.0) , 
RLIMIT NICE (Linux3.2.0) , 
RLIMIT NPROC (FreeBSD 8.0. Linux 3.2.0. 
Mac OS X 10.6.8) , 
RLIMIT_NPTS (FreeBSD 8.0) , 
RLIMIT RSS (FreeBSD 8.0, Linux 3.2.0, 
Mac OS X 10.6.8) , 
RLIMIT_SBSIZE (FreeBSD 8.0) , 
RLIMIT_SIGPENDING (Linux 3.2.0) , 
RLIMIT_SWAP (FreeBSD 8.0) , 
RLIMIT_VMEM (Solaris 10) 


RE: FRH, iO; 若 出 错 ， 返 回 -1 


setservent(int stayopen); 
<netdb.h> 


setsid(void); 


<unistd.h> 


返回 值 : 若 成 功 ， 返 回 进程 组 ID， 若 出 错 ， 返 回 -1 


setsockopt (int sockfd, 
socklen_t 


int level, int option, const void *val, 
len); 


<sys/socket.h> 


返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 


setspent (void) ; 


<shadow.h> 
平台 : Linux 3.2.0. Solaris 10 


setuid(uid t uid); 


«unistd.h» 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


setvbuf (FILE *restrict fp, char *restrict buf, int mode, 


size_t size); 


<stdio.h> 
mode: _IOFBF, IOLBF. _IONBF 
返回 值 : 若 成 功 ， 返 回 0: 若 出 错 ， 返 回 非 0 


*shmat (int shmid, const void *addr, int flag); 
<sys/shm.h> 
flag: SHM RND. SHM RDONLY 


返回 值 ， 若 成 功 ， 返 回 指向 共享 存储 段 的 指针 ， 若 出 错 ， 返 回 -1 


p. 257 


p. 257 


p. 220 


p. 599 


p. 295 


p. 624 


p. 182 


p. 256 


p. 146 


p. 574 
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int shmctl(int shmid, int cmd, struct shmid ds *buf); 
<sys/shm.h> p. 573 
cmd: IPC STAT, IPC SET, IPC RMID, 
SHM LOCK (Linux 3.2.0. Solaris 10) , 
SHM UNLOCK (Linux 3.2.0. Solaris 10) 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


int shmdt (const void *addr) ; 
<sys/shm.h> p. 574 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 

int shmget (key t key, size t size, int flag); 
<sys/shm.h> p. 572 


flag: IPC_CREAT, IPC EXCL 
返回 值 : 若 成 功 ， 返 回 非 负 共享 存储 ID; 若 出 错 ， 返 回 -1 


int shutdown (int sockfd, int how); 
<sys/socket.h> p. 592 
how: SHUT RD. SHUT WR. SHUT RDWR 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


int sig2str(int signo, char *str); 
<signal.h> p. 380 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 
平台 : Solaris 10 


int sigaction(int signo, const struct sigaction *restrict act, 
struct sigaction *restrict oact) ; 
<signal.h> p. 350 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 
int sigaddset(sigset t *sef, int signo); 
<signal.h> p. 344 
[884 | 返回 值 ， 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 
int sigdelset(sigset t *sef, int signo); 
<signal.h> p. 344 
返回 值 ; 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 
int sigemptyset(sigset t *sef); 
<signal.h> p. 344 
返回 值 ， 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 
int sigfillset(sigset t *sef); 
<signal.h> p. 344 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 
int sigismember (const sigset t *sef, int signo); 
<signal.h> p. 344 
返回 值 : 若 真 ， 返 回 1; 若 假 ， 返 回 0; FH, ge- 
void siglongjmp(sigjmp buf env, int val); 
<setjmp.h> p. 356 
此 函数 不 返回 
Void (*signal (int signo, void (*func) (int))) (int); 
<signal.h> p. 323 
返回 值 : 车 成 功 ， 返 回 以 前 的 信号 处 理 配 置 ， 若 出 错 ， 返 回 SIG ERR 
int sigpending(sigset t *sef); 
<signal.h> p. 347 


返回 值 : FRH, BO; 若 出 错 ， 返 回 -1 
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sigprocmask(int how, const sigset_t *restrict set, 
sigset t *restrict oset); 
<signal.h> p. 346 
how: SIG BLOCK. SIG UNBLOCK. SIG SETMASK 
返回 值 : 若 成 功 ， 返 回 0; 车 出 错 ， 返 回 -1 


sigqueue (pid t pid, int signo, const union sigval value) 
<signal.h> p. 376 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


sigsetjmp(sigjmp buf env, int savemask) ; 
<setjmp.h> p. 356 
返回 值 : 若 直接 调用 ， 返 回 0; 若 从 siglongjmp 调用 返回 ， 返 回 非 0 fii 


sigsuspend(const sigset t *sigmask) ; 
<signal.h> p. 359 
返回 值 : -1, errno REX EINTR 


sigwait(const sigset t *restrict set, int *restrict signop); 
<signal.h> p. 454 
返回 值 : 老成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


sleep(unsigned int seconds) ; 
<unistd.h> p. 373 
返回 值 : 0 或 未 休眠 的 秒 数 


snprintf (char *restrict buf, size_t n, 
const char *restrict format, ...); 
<stdio.h> p. 159 
返回 值 : 若 缓冲 区 足够 大 ， 返 回 存 入 数组 的 字符 数 ; 若 编码 出 错 ， 返 回 负 值 


sockatmark (int sockfd) ; 
<sys/socket.h> p. 626 
返回 值 : 若 在 标记 处 ， 返 回 1; 若 没 在 标记 处 ， 返 回 0; 若 出 错 ， 返 回 -1 


socket(int domain, int type, int protocol); 
<sys/socket.h> p. 590 
type: SOCK STREAM. SOCK DGRAM. SOCK_SEQPACKET 
返回 值 : 若 成 功 ， 返 回 文件 〈 套 接 字 ) 描述 符 ， 若 出 错 ， 返 回 -1 


socketpair(int domain, int type, int protocol, int sockfd[2]); 
<sys/socket.h> p. 630 
type: SOCK_STREAM, SOCK_DGRAM, SOCK SEQPACKET 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


sprintf (char *restrict buf, const char *restrict format, ...); 
<stdio.h> p. 159 
返回 值 : 若 成 功 ， 返 回 存 入 数组 的 字符 数 ， 若 编码 出 错 ， 返 回 负 值 


sscanf(const char *restrict buf, 
const char *restrict format, ...); 
<stdio.h> p. 162 
返回 值 : 赋值 的 输入 项 数 ， 车 输入 出 错 或 在 任 一 转换 前 已 到 达 文 件 尾 端 ， 返回 EOF 


stat(const char *restrict path, struct stat *restrict buf); 
<sys/stat.h> p. 93 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


str2sig(const char *sír, int *signop); 
<signal.h> p. 380 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


886 
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char 


size t 


size t 


char 


char 


int 


int 


void 


long 


函数 原型 


平台 : Solaris 10 


*strerror(int errnum) ; 


<string.h> 


返回 值 : 指向 消息 字符 串 的 指针 


strftime(char *restrict buf, size_t maxsize, 
const char *restrict format, 
const struct tm *restrict fmptr); 
«time.h» 


返回 值 : 车 有 空间 ， 返 回 存 入 数组 的 字符 数 ， 否 则 ， 返 回 0 


strftime l(char *restrict buf, size t maxsize, 
const char *restrict format, 
const struct tm *restrict tmptr, locale t locale); 
<time.h> 


返回 值 : 车 有 空间 ， 返 回 存 入 数组 的 字符 数 ， 否 则 ， 返 回 0 


*strptime(const char *restrict buf, const char *restrict format, 
struct tm *restrict fmptr); 
«time.h» 


返回 值 ， 指 向 上 次 解析 的 字符 的 下 一 个 字符 的 指针 ; 否则 ， 返 回 NULL 


*strsignal (int signo) ; 
<string.h> 


返回 值 ; 说 明 该 信号 字符 串 的 指针 


symlink(const char *actualpath, const char *sympath) ; 
<unistd.h> 


返回 值 ， 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


symlinkat (const char *actualpath, int fd, const char *sympath) ; 
<unistd.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


sync (void); 
<unistd.h> 


sysconf (int name); 

<unistd.h> 

name: SC ARG MAX. SC ASYNCHRONOUS IO. 
.SC ATEXIT MAX. $SC BARRIERS, 
.SC CHILD MAX. SC CLK TCK. 
.SC CLOCK SELECTION. SC COLL WEIGHTS MAX, 
.SC DELAYTIMER MAX. SC HOST NAME MAX, 
.SC IOV MAX. SC JOB CONTROI4, 
.SC LINE MAX. SC LOGIN NAME MAX, 
SC MAPPED FILED. SC MEMORY PROTECTION, 
.SC NGROUPS MAX. $SC OPEN MAX, 
.SC PAGESIZE. SC PAGE SIZE. 
.SC READER WRITER LOCKS. 
.SC REALTIME SIGNALS. $SC RE DUP MAX. 
.SC RTSIG MAX. SC SAVED IDS. 
_SC_SEMAPHORES, SC SEM NSEMS MAX, 
.SC SEM VALUE MAX. $SC SHELL. 
.SC SIGQUEUE MAX. SC SPIN LOCKS. 
SC STREAM MAX. SC SYMLOOP MAX, 
SC THREAD SAFE FUNCTIONS, 
.SC THREADS. SC TIMER MAX. 
.SC TIMERS. SC TTY NAME MAX, 


.15 


192 


. 192 


. 195 


.380 


; 123 


. 123 


.81 


.42 


void 


int 


int 


int 


int 


int 


pid_t 


pid_t 


int 


int 


int 


long 


time_t 


clock_t 


_SC_TZNAME_MAX, $SC VERSION. 
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.SC XOPEN CRYPT. $SC XOPEN REALTIME. 
.SC XOPEN REALTIME THREADS. SC XOPEN SHM 


.SC XOPEN VERSION 
返回 值 : 若 成 功 ， 返 回 相应 值 ， 若 出 错 ， 返 回 -1 


syslog(int priority, char *format, ...); 
<syslog.h> 


system(const char *cmdstring) ; 
<stdlib.h> 
返回 值 : shell 的 终端 状态 


tcdrain(int fd); 
«termios.h» 


返回 值 : 车 成 功 ， 返 回 0;， 若 出 错 ， 返 回 -1 


tcflow(int fd, int action) ; 
<termios.h> 
action: TCOOFF, TCOON, TCIOFF, TCION 
返回 值 : 着 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


tcflush(int fd, int queue); 
<termios.h> 
queue: TCIFLUSH. TCOFLUSH. TCIOFLUSH 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


tcgetattr(int fd, struct termios *fermptr) ; 
<termios.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


tcgetpgrp(int fd); 
<unistd.h> 


p. 470 


p. 265 


p. 693 


p. 693 


p. 693 


p. 683 


p. 298 


返回 值 : 若 成 功 ， 返 回 前 台 进 程 组 ID; 若 出 错 ， 返 回 -1 


tcgetsid(int fd); 
<termios.h> 


p. 299 


返回 值 : 车 成 功 ， 返 回 会 话 首 进程 的 进程 组 ID; 若 出 错 ， 返 回 -1 


tcsendbreak (int fd, int duration) ; 
<termios.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


p. 693 


tcsetattr(int fd, int opt, const struct termios *fermptr); 


<termios.h> 
opt: TCSANOW. TCSADRAIN. TCSAFLUSH 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


tcsetpgrp(int fd, pid t pgrpid); 
«unistd.h» 


返回 值 : 车 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


telldir(DIR *dp); 
<dirent.h> 


返回 值 : 与 dp 关联 的 目录 中 的 当前 位 置 


time (time t *calptr) ; 
«time.h» 


返回 值 : 若 成 功 ， 返 回 时 间 值 ， 若 出 错 ， 返 回 -1 


times(struct tms *buf); 
<sys/times.h> 


p. 683 


p. 298 


p. 130 


p. 189 


p. 280 


返回 值 : 车 成 功 ， 经 过 的 墙 上 时 钟 时 间 ， 若 出 错 ， 返 回 -1 
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FILE 


char 


int 


char 


mode_t 


int 


int 


int 


int 


int 


int 


int 


int 


int 


int 


*tmpfile(void); 
<stdio.h> 


返回 值 : 若 成 功 ， 返 回 文件 指针 ; 若 出 错 ， 返 回 NULL 


*tmpnam (char *ptr); 
<stdio.h> 


返回 值 : 指向 唯一 路 径 名 的 指针 ， 若 出 错 ， 返 回 NULL 


truncate(const char *path, off t length); 
«unistd.h» 


返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 


*ttyname (int fd); 
<unistd.h> 


返回 值 ， 指 向 终端 路 径 名 的 指针 ， 若 出 错 ， 返 回 NULL 


umask (mode_t cmask) ; 
<sys/stat.h> 


返回 值 : 之 前 的 文件 模式 创建 屏蔽 字 


uname (struct utsname *name) ; 
<sys/utsname.h> 


返回 值 : FRH, BEENA: 若 出 错 ， 返 回 -1 


ungetc(int c, FILE *fp); 
<stdio.h> 


返回 值 : FRH, BE c; 若 出 错 ， 返 回 BOF 


unlink(const char *path) ; 
<unistd.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


unlinkat(int fd, const char *path, int flag); 
<unistd.h> 
flag: AT_REMOVEDIR 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


unlockpt (int fd); 
<stdlib.h> 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


unsetenv(const char *name) ; 
<stdlib.h> 
返回 值 ， 若 成 功 ， 返 回 0; 车 出 错 ， 返 回 -1 


utimensat (int fd, const char *path, 
const struct timespec /imes[2], int flag); 
<sys/stat.h> 
flag: AT_SYMLINK_NOFOLLOW 
返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 


utimes(const char *path, const struct timeval times[2]); 
<sys/time.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


vdprintf(int fd, const char *restrict format, va list arg); 
<stdarg.h> 
<stdio.h> 


返回 值 : 车 成 功 ， 返 回 输出 字符 数 ， 若 输出 出 错 ， 返 回 负 值 


vfprintf(FILE *restrict fp, const char *restrict format, 
va list arg); 





p. 167 


p. 167 


p. 695 


p. 104 


p.187 


p.723 


p.212 


p. 126 


p.127 


p. 161 


int 


int 


int 


int 


int 


int 


void 


pid_t 


int 


pid_t 


pid_t 
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<stdarg.h> p. 161 
<stdio.h> 


返回 值 : 若 成 功 ， 返 回 输 出 字符 数 ; 若 输出 出 错 ， 返 回 负 值 


vfscanf (FILE *restrict fp, const char *restrict format, va list arg); 
<stdarg.h> p. 163 
<stdio.h> 


返回 值 : 指定 的 输入 项 目 数 ， 若 输入 出 错 或 在 任 一 转换 前 文件 结束 ， 返 回 EOF 


vprintf(const char *restrict format, va list arg); 
<stdarg.h> p. 161 
<stdio.h> 


返回 值 : 若 成 功 ， 返 回 输出 字符 数 ， 若 输出 出 错 ， 返 回 负 值 


vseanf (const char *restrict format, va list arg); 
<stdarg.h> p. 163 
<stdio.h> 


返回 值 : 指定 的 输入 项 目 数 ， 若 输入 出 错 或 在 任 一 转换 前 文件 结束 ， 返 回 EOF 


vsnprintf (char *restrict buf, size t n, 
const char *restrict format, va list arg); 
<stdarg.h> p. 161 
<stdio.h> 


返回 值 : 若 缓冲 区 足够 大 ， 返 回 存 入 数组 的 字符 数 ， 若 编码 出 错 ， 返 回 负 值 


vsprintf(char *restrict buf, const char *restrict format, 
va list arg); 
<stdarg.h> p. 161 
<stdio.h> 


返回 值 : 若 成 功 ， 返 回 存 入 数组 的 字符 数 ， 若 编码 出 错 ， 返 回 负 值 


vsscanf (Const char *restrict buf, const char *restrict format, 
va_list arg); 
<stdarg.h> p. 163 
<stdio.h> 


返回 值 : 指定 的 输入 项 目 数 ， 若 输入 出 错 或 在 任 一 转换 前 文件 结束 ， 返 回 EOF 


vsyslog(int priority, const char *format, va_list arg); 
<syslog.h> p. 472 
<stdarg.h> 
台 : FreeBSD 8.0, Linux 3.2.0, Mac OS X 10.6.8. Solaris 10 


wait(int *statloc) ; 
<sys/wait.h> p. 238 
返回 值 :车 成 功 ， 返 回 进程 ID; 若 出 错 ， 返 回 0 或 -1 


waitid(idtype t idtype, id t id, siginfo t *infop, int options) ; 
<sys/wait.h> p. 244 
idtype: P PID. P PGID. P ALL 
options: WCONTINUED. WEXITED. WNOHANG. WNOWAIT. WSTOPPED 
返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 
平台 : Linux 3.2.0、Solaris 10 


waitpid(pid t pid, int *statloc, int options) ; 
<sys/wait.h> p. 238 
options: WCONTINUED. WNOHANG. WUNTRACED 
返回 值 : 若 成 功 ， 返 回 进程 ID; 若 出 错 ， 返 回 0 或 -1 


wait3(int *statloc, int options, struct rusage *rusage); 
<sys/types.h> p. 245 
<sys/wait.h> 
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pid_t 


ssize t 


ssize t 


wait4(pid t pid, int *statloc, int options, struct rusage *rusage) ; 


write(int fd, 


<sys/time.h> 

<sys/resource.h> 

options: WNOHANG. WUNTRACED 

返回 值 ， 若 成 功 ， 返 回 进 程 ID; 若 出 错 ， 返 回 0 或 -1! 

平台 : FreeBSD 8.0、Linux 3.2.0、Mac OS X 10.6.8、Solaris 10 


<sys/types.h> 

<sys/wait.h> 

<sys/time.h> 

<sys/resource.h> 

options: WNOHANG. WUNTRACED 

返回 值 : 若 成 功 ， 返 回 进程 ID; 若 出 错 ， 返 回 0 或 -1 

平台 : FreeBSD 8.0、Linux 3.2.0、Mac OS X 10.6.8、Solaris 10 


const void *buf, size_t nbytes); 
<unistd.h> 


BE: 若 成 功 ， 返 回 已 写 的 字 节 数 ， 若 出 错 ， 返 回 -1 


writev(int fd, const struct iovec *iov, int iovent) ; 


<sys/uio.h> 


返回 值 ， 若 成 功 ， 返 回 已 写 的 字 节 数 ， 若 出 错 ， 返 回 -1 


p. 245 


p. 72 


p. 521 


附录 B 


B.1 本 书 使 用 的 头 文件 


本 书 中 的 大 多 数 程序 都 包含 头 文件 apue .h, 如 图 B-1 所 示 。 其 中 定义 了 常量 (如 MAXLINE) 
和 我 们 自 编 函数 的 原型 。 

大 多 数 程序 都 需要 包含 下 列 头 文件 ，<stdio.h>、<stdlib.h> (HPA exit 函数 原型 ) 
和 <unistd.h> (其 中 包含 所 有 标准 UNIX 函数 的 原型 )， 因 此 头 文件 apue.h 自动 包含 了 这 些 
系统 头 文件 ， 同 时 还 包含 了 <string.h>。 这 样 就 减少 了 本 书 中 所 有 程序 的 长 度 。 





/* 


* Our own header, 


wi! 


#ifndef _APUE_H 
#define _APUE_H 


#define _POSIX_C_SOURCE 200809L 


Rif defined (SOLARIS) 
#define _XOPEN_SOURCE 600 


#else 


/* Solaris 10 */ 


#define _XOPEN_SOURCE 700 


#endif 


#include <sys/types.h> 


#include <sys/stat.h> 


#include <sys/termios.h> 


#if defined(MACOS) || 


#include <sys/ioctl.h> 


#endif 


#include 
#include 
#include 
#include 
#include 
#include 





#define 


/* 


<stdio.h> 


<stdlib. 
<stddef. 
<string. 
<unistd. 
.h» 


«signal 


MAXLINE 


h» 
h> 
h> 
h> 


4096 


/* some systems still require this */ 


/* for winsize */ 


!defined (TIOCGWINSZ) 


/* 
/* 
/* 
/* 
/* 
/* 


/* 


for 
for 
for 
for 
for 
for 


max 





convenience 
convenience 
offsetof */ 
convenience 
convenience 
SIG_ERR */ 


line length 


to be included before all standard system headers. 


* 
kf 


ul d 
Ey 


at 


其 他 源 代码 
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* Default file access permissions for new files. 


*y 
#define FILE MODE (S IRUSR | S IWUSR | S IRGRP | S IROTH) 
/* 
* Default permissions for new directories. 
xy 
#define DIR MODE (FILE MODE | S IXUSR | S IXGRP | S IXOTH) 
typedef void Sigfunc(int);/* for signal handlers */ 
#define min(a,b) (a) « (by 2 Cay & (b)) 
#define max(a,b) ((a) > (b) ? (a) * (by) 
/* 
* Prototypes for our own functions. 
wf 
char *path_alloc(size_t *); /* Figure 2,16 */ 
long open_max (void) ; /* Figure 2.17 */ 
int set_cloexec(int); /* Figure 13.9 */ 
void Ele FL (int; int) 
void set_fl(int, int); /* Figure 3.12 */ 
void pr_exit (int); /* Figure 8.5 */ 
void pr mask(const char *); /* Figure 10.14 */ 
Sigfunc *signal intr(int, Sigfunc *); /* Figure 10.19 */ 
void daemonize(const char *); /* Figure 13.1 */ 
void sleep us(unsigned int); /* Exercise 14.5 */ 
ssize t readn(int, void *, size t); /* Figure 14.24 */ 
ssize_t writen(int, const void *, size t); /* Figure 14.24 */ 
int fd pipe(int *); 7* Figure 17.2 */ 
int recv fd(int, ssize t (*func) (int, 

const void *, size t)); /* Figure 17.14 */ 
int send fd(int, int); /* Figure 17.13 */ 
int send err(int, int, 

onst char *); /* Figure 17.12 */ 
int serv listen(const char *); /* Figure 17.8 */ 
int serv accept(int, uid t *); /* Figure 17.9 */ 
int cli conn(const char *); /* Figure 17.10 */ 
int buf args(char *, int (*func) (int, 

char **3); /* Figure 17.23 */ 
int tty cbreak (int); /* Figure 18.20 *7 
int tty raw(int); /* Figure 18.20 */ 
int tty reset (int); /* Figure 18.20 */ 
void tty atexit(void); /* Figure 18.20 */ 
struct termios *tty termios (void); /* Figure 18.20 */ 
int ptym open(char *, int); /* Figure 19.9 */ 


int ptys open(char *); /* Figure 19.9 */ 


#ifdef 
pid_t 


#endif 


int 


#define 


#define 


#define 


#define 


#define 


pid_t 


#define 


#define 


void 
void 
void 
void 
void 
void 
void 


void 
void 
void 
void 
void 
void 


void 
void 
void 
void 
void 


#fendif 


TIOCGWINSZ 
pty_fork(int 
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*, char *, int, const struct termios *, 


const struct winsize *); /* Figure 19.10 */ 


lock_reg(int, 


read_lock (fd, 


int, int, off t, int, off t); /* Figure 14.5 */ 


offset, whence, len) \ 


lock reg((fd), F SETLK, F RDLCK, (offset), (whence), (len)) 


readw lock(fd, 


offset, whence, len) \ 


lock reg((fd), F SETLKW, F RDLCK, (offset), (whence), (len)) 


write lock(fd, 


offset, whence, len) \ 


lock reg((fd), F SETLK, F WRLCK, (offset), (whence), (len)) 
writew lock(fd, offset, whence, len) \ 


lock reg((fd), F SETLKW, F WRLCK, (offset), (whence), (len)) 
un lock(fd, offset, whence, len) \ 
lock reg((fd), F SETLK, F UNLCK, (offset), (whence), (len)) 


lock test (int, 


int, Off t, int, OEE t); /* Figure 14.6 */ 


is read lockable(fd, offset, whence, len) \ 


(lock test((fd), F RDLCK, (offset), (whence), (len)) == 0) 
is write lockable(fd, offset, whence, len) \ 

(lock test((fd), F WRLCK, (offset), (whence), (len)) -- 0) 
err msg(const char *, ...); /* Appendix B */ 
err dump(const char *, ...) | attribute ((noreturn)); 
err quit(const char *, ...) | attribute ((noreturn)); 
err cont (int, const char *, ...); 
err exit(int, const char *, ...) attribute ((noreturn)); 
err ret(const char *, ...); 
err sys(const char *, ...) | attribute ((noreturn)); 
log msg(const char *, ...); /* Appendix B */ 


log open(const char *, int, int); 


log quit(const char *, ...) | attribute ((noreturn)); 

log ret(const char *, ...); 

log sys(const char *, ...) | attribute ((noreturn) ); 

log exit(int, const char *, ...) attribute ((noreturn)); 

TELL WAIT (void); /* parent/child from Section 8.9 */ 


TELL PARENT (pid t); 
TELL CHILD (pid t); 
WAIT PARENT (void); 
WAIT CHILD(void); 


/* _APUE_H */ 


图 B-1 头 文件 apue.h 


程序 中 先 包 括 apue .h， 然 后 再 包括 一 般 系统 头 文件 ， 这 样 就 使 我 们 易于 做 到 下 列 各 点 : 可 
以 先 定义 一 些 在 此 后 包括 的 头 文件 可 能 要 求 的 部 分 ， 能 够 控制 头 文件 被 包括 的 顺序 ;能够 重 定义 
某 些 部 分 ， 而 这 正 是 为 隐藏 两 个 系统 之 间 的 差别 而 需要 解决 的 。 
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B.2 标准 出 错 例 程 


我 们 提供 了 两 套 出 错 函 数 ， 用 于 本 书 中 大 多 数 实例 以 处 理 各 种 出 错 情况 。 一 套 以 err_ 开头， 
并 向 标准 错误 输出 一 条 出 错 消息 。 另 一 套 以 10g_ 开 头 ， 用 于 守护 进程 ( 见 第 13 章 )， 


没有 控制 终端 。 


之 所 以 提供 我 们 自己 的 出 错 函数 ， 是 为 了 能 够 编写 只 有 一 行 C 代码 的 出 错 处 理 程序 


if (出 错 条 件 ) 
err dump ( 带 任 意 参 数 的 printf Hx); 


这 样 就 不 再 需要 使 用 下 列 代码 : 


if (出 错 条 件 ) ( 
char buf[200]; 


sprintf (buf， 带 任意 参数 的 printf 格式 ) ; 
perror (buf); 
abort (); 

} 


它们 多 半 


， 例 如 : 


我 们 的 出 错 处 理 函 数 使 用 了 ISO C 的 变 长 参数 表 功 能 。 其 详细 说 明 见 Kernighan 和 
Ritchie[1988] 的 7.3 节 。 应 当 注 意 的 是 ， 这 个 ISO C 功能 与 早期 系统 (如 SVR3 和 4.3BSD) 提供 


的 varargs 功能 不 同 。 宏 的 名 字 相 同 ， 但 更 改 了 某 些 宏 的 参数 。 
图 B-2 列 出 了 各 个 出 错 函 数 之 间 的 区 别 。 





err ee ee | errno 
err_exit 显 式 参数 
err_msg 
err_quit 
err_ret 
err_sys 
err_cont 
log_msg 
log_quit 
log_ret 
log_sys 


A 
f 
T 
是 
是 
是 
f 
f 
是 
是 
是 


log_exit 
图 B-2 标准 出 错 函 数 
图 B-3 包括 了 输出 至 标准 错误 的 各 个 出 错 函数 。 


#include "apue.h" 


#include <errno.h> /* for definition of errno */ 
#include <stdarg.h> /* ISO C variable aruments */ 


static void err doit(int, int, const char *, va list); 


/* 
* Nonfatal error related to a system call. 





abort(); 
exit(1); 
return; 
exit(1); 
return; 
exit(1); 
return; 
return; 
exit (2); 
return; 
exit (2); 
exit (2); 
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* Print a message and return. 


*/ 
void 
err ret(const char *fmt, ...) 
{ 
va_list ap; 


va_start(ap, fmt); 
err doit(1, errno, fmt, ap); 
va end(ap); 


/* 

* Fatal error related to a system call. 
* Print a message and terminate. 

ku 

void 

err sys(const char *fmt, ...) 

{ 


va_list ap; 


va_start(ap, fmt); 

err doit(1, errno, fmt, ap); 
va end(ap); 

exit (1); 


* Nonfatal error unrelated to a system call. 
* Error code passed as explict parameter. 
* Print a message and return. 
Ry 
void 
err_cont(int error, const char *fmt, ...) 
{ 
va_list ap; 


va start(ap, fmt); 
err doit(1, error, fmt, ap); 
va end(ap); 


* Fatal error unrelated to a system call. 
* Error code passed as explict parameter. 
* Print a message and terminate. 
Ey 
void 
err_exit(int error, const char *fmt, ...) 
{ 


va_list ap; 


va_start(ap, fmt); 
err doit(1, error, fmt, ap); 
va end(ap); 
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exit(1); 


/* 

* Fatal error related to a system call. 

* Print a message, dump core, and terminate. 
uid 


void 
err_dump(const char *fmt, ...) 
{ 
va_list ap; 
va_start(ap, fmt); 
err doit(1, errno, fmt, ap); 
va end (ap); 
abort(); /* dump core and terminate */ 
exit (1); /* shouldn't get here */ 
} 
/* 


* Nonfatal error unrelated to a system call. 
* Print a message and return. 
* f 

void 

err msg(const char *fmt, ...) 

{ 


va_list ap; 


va_start(ap, fmt); 
err doit(0, 0, fmt, ap); 
va end(ap); 


/* 
* Fatal error unrelated to a system call. 
* Print a message and terminate. 


kd 
void 
err quit(const char *fmt, ...) 
{ 
va_list ap; 
va_start(ap, fmt); 
err dolt(0, 0, fmt, ap)? 
va end(ap) ; 
exit(1); 
} 
/* 


* Print a message and return to caller. 
* Caller specifies "errnoflag". 

à 

static void 


err doit(int errnoflag, int error, const char *fmt, 


{ 





va_list ap) 
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char buf [MAXLINE]; 


vsnprintf (buf, MAXLINE-1, fmt, ap); 
if (errnoflag) 
snprintf(buf*strlen(buf), MAXLINE-strlen(buf)-1, ": %s", 
strerror(error)); 
Strcat(buf, "Xn"); 


fflush(stdout); /* in case stdout and stderr are the same */ 
fputs(buf, stderr); 
fflush(NULL); /* flushes all stdio output streams */ 


图 B-3 输出 至 标准 错误 的 出 错 函 数 


图 B-4 包括 了 各 log XXX 出 错 函 数 。 若 进程 不 以 守护 进程 方式 运行 ， 那 么 调用 者 应 当 定 义 
变量 1og_ to_stderr， 并 将 其 设置 为 非 0 值 。 在 这 种 情况 下 ， 出 错 消息 被 发 送 至 标准 错误 。 若 
log to stderr 标志 为 0， 则 使 用 syslog 设施 〈 见 13.4 节 )。 


/* 
* Error routines for programs that can run as a daemon. 
wf 


#include "apue.h" 

#include <errno.h> /* for definition of errno */ 
#include <stdarg.h> /* ISO C variable arguments */ 
#include <syslog.h> 


static void log_doit(int, int, int, const char *, va_list ap); 


/* 

* Caller must define and set this: nonzero if 
* interactive, zero if daemon 

ep 

extern int log_to_stderr; 


/* 
* Initialize syslog(), if running as daemon. 
ef 
void 
log_open(const char *ident, int option, int facility) 
{ 

if (log_to_stderr == 0) 

openlog(ident, option, facility); 


/* 

* Nonfatal error related to a system call. 

* Print a message with the system's errno value and return. 
x, 

void 

log ret(const char *fmt, ...) 

{ 


va_list ap; 


va_start(ap, fmt); 
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log doit(1, errno, LOG ERR, fmt, ap); 
va end (ap); 


/* 

* Fatal error related to a system call. 
* Print a message and terminate. 

*/ 

void 

log sys(const char *fmt, ...) 

{ 


va_list ap; 


va_start(ap, fmt); 

log_doit(1, errno, LOG_ERR, fmt, ap); 
va_end (ap); 

exit (2); 


/* 
* Nonfatal error unrelated to a system call. 
* Print a message and return. 


ay 
void 
log_msg(const char *fmt, ...) 
{ 
va_list ap; 


va_start(ap, fmt); 
log_doit(0, 0, LOG_ERR, fmt, ap); 
va_end (ap); 


/* 

* Fatal error unrelated to a system call. 
* Print a message and terminate. 

ER 

void 

log_quit(const char *fmt, ...) 

{ 


va_list ap; 


va_start(ap, fmt); 

log_doit(0, 0, LOG_ERR, fmt, ap); 
va_end (ap); 

exit (2); 


/* 

* Fatal error related to a system call. 

* Error number passed as an explicit parameter. 
* Print a message and terminate. 

*/ 

void 

log exit(int error, const char *fmt, ...) 
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va_list ap; 


va_start(ap, fmt); 

log doit(1, error, LOG ERR, fmt, ap); 
va end(ap); 

exit(2); 


/* 
* Print a message and return to caller. 
* Caller specifies "errnoflag" and "priority". 
*/ 
static void 
log_doit(int errnoflag, int error, int priority, const char *fmt, 

va_list ap) 


char buf [MAXLINE] ; 


vsnprintf (buf, MAXLINE-1, fmt, ap); 
if (errnoflag) 
snprintf (buf+strlen (buf), MAXLINE-strlen(buf)-1, ": %s", 
strerror(error) ); 
streat (buf, "\n"); 
if (log_to_stderr) { 
fflush (stdout) ; 
fputs (buf, stderr); 
fflush (stderr); 
} else { 
syslog(priority, "%s", buf); 
} 


图 B-4 用 于 守护 进程 的 出 错 函数 904 
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第 1 章 
1.1 ”这 个 习题 利用 1s() 命 令 的 下 面 两 个 参数 : -i 打印 文件 或 目录 的 i 节点 编号 (4.14 节 详 细 讨 
论 了 i 节点 ); -da 仅 打印 目录 信息 ， 而 不 是 打印 目录 中 所 有 文件 的 信息 。 
执行 下 列 命令 : 
$ 1s -ldi /etc/. /etc/.. -i 要 求 打 印 i 节点 编号 
162561 drwxr-xr-x 66 root 4096 Feb 5 03:59 /etc/./ 
2 drwxr-xr-x 19 root 4096 Jan 15 07:25 /etc/../ 
& 1s -tai J. 7.5 A. .的 i 节点 编号 均 为 2 
2 drwxr-xr-x 19 root 4096 Jan 15 07:25 /./ 
2 drwxr-xr-x 19 root 4096 Jan 15 07:25 /../ 
12. UNIX 系统 是 多 道 程序 或 多 任务 系统 ， 所 以 ， 在 图 1-6 所 示 程 序 运行 的 同时 其 他 两 个 进程 也 
在 运行 。 
1.3 ”因为 perror 的 msg 参数 是 一 个 指针 ，perror 就 可 以 改变 msg 指 问 的 字符 串 。 然 而 使 用 
限定 符 const 限制 了 perror 不 能 修改 msg 指针 指向 的 字符 串 。 而 对 于 strerror, 其 错 
误 号 参数 是 整数 类 型 ， 并 且 C 是 按 值 传递 所 有 参数 ， 因 此 即使 strerror 函数 想 修 改 参数 
的 值 也 修改 不 了 ， 也 就 没有 必要 使 用 const AE. ORI C 中 函数 参数 的 处 理 不 是 很 清 
楚 ， 可 参见 Kernighan 和 Ritchie[1988] 的 5.2 节 。) 
14 在 2038 年 。 将 time t 数据 类 型 定 为 64 位 整 型 ， 就 可 以 解决 该 问题 了 。 如 果 它 现在 是 32 
位 整 型 ， 那 么 为 使 应 用 程序 正常 工作 ， 应 当 对 其 重 编译 。 但 是 这 一 问题 还 有 更 糟糕 之 处 。 
某 些 文件 系统 及 备份 介质 以 32 位 整 型 存放 时 间 。 对 于 这 些 同 样 需 要 加 以 更 新 ， 但 又 需要 能 
读 旧 的 格式 。 
1.5. 大约 248 X. 
7825 
2. ”下 面 是 FreeBSD 中 使 用 的 技术 。 在 头 文件 <machine/_types.h> 中 定义 可 在 多 个 头 文件 中 


出 现 的 基本 数据 类 型 。 例 如 : 


#ifndef MACHINE TYPES H_ 
#define MACHINE TYPES H_ 


typedef int . Ant32 t; 
typedef unsigned int  .  uint32 t; 


typedef _ uint32 t . Size t; 
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#endif /* MACHINE TYPESH */ 
在 每 个 可 以 定义 基本 数据 类 型 size t 的 头 文件 中 ， 包 含 下 面 的 语句 序列 。 


#ifndef _SIZE_T_DECLARED 


typedef  sizet size t; 
#define SIZE T DECLARED 
#tendif 


这 样 ， 实 际 上 只 执行 一 次 size 七 的 typedef。 
2.3 WMR OPEN MAX 是 未 确定 的 或 大 得 出 奇 〈 即 等 于 Lons _MAX)， 那 么 可 以 使 用 getrlimit 
得 到 每 个 进程 的 最 大 打开 文件 描述 符 数 。 因 为 可 以 修改 对 每 个 进程 的 限制 ， 所 以 我 们 不 能 
将 前 一 个 调用 得 到 的 值 高 速 缓存 起 来 〈 它 可 能 已 被 更 改 )， 见 图 C-1。 


#include "apue.h" 
#include <limits.h> 
#include <sys/resource.h> 


#define OPEN MAX GUESS 256 


long 

open max (void) 

{ 
long openmax; 
struct rlimit rl; 


if ((openmax = sysconf( SC OPEN MAX)) < 0 || 
openmax == LONG MAX) { 
if (getrlimit(RLIMIT NOFILE, &rl) < 0) 
err sys("can't get file limit"); 


if (rl.rlim max == RLIM INFINITY) 
openmax = OPEN MAX GUESS; 
else 
openmax = rl.rlim max; 


} 


return (openmax) ; 





图 C-1 标识 最 大 可 能 文件 描述 符 的 替换 方法 


第 3 章 


3.1 ”所 有 磁盘 VO 都 要 经 过 内 核 的 块 缓存 区 〈 也 称 为 内 核 的 缓冲 区 高 速 缓存 )。 唯 一 例外 的 是 对 
原始 磁盘 设备 的 IO， 但 是 我 们 不 考虑 这 种 情况 (Bach[1986] 的 第 3 章 讲 述 了 这 种 缓存 区 高 
速 缓存 的 操作 )。 既 然 read 或 write 的 数据 都 要 被 内 核 缓冲 ,那么 术语 “不 带 缓冲 的 110” 
指 的 是 在 用 户 的 进程 中 对 这 两 个 函数 不 会 自动 缓冲 ， 每 次 read 或 write 就 要 进行 一 次 系 
统 调 用 。 

3.3 ”每 次 调用 open 函数 就 分 配 一 个 新 的 文件 表 项 。 但 是 因为 两 次 打开 的 是 同一 个 文件 , 则 两 个 
文件 表 项 指向 相同 的 v 节点 。 调 用 dup 引用 已 存在 的 文件 表 项 〈 此 处 指 £a1 的 文件 表 项 )， 
见 图 C-2. “4 F sETFD 作用 于 fal 时 ， 只 影响 fal 的 文件 描述 符 标 志 ; F_SETFL 作用 于 
fal 时 ， 则 影响 fal 及 fq2 指向 的 文件 表 项 。 
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3.4 


3.5 


3.6 
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进程 表 项 文件 表 
文件 状态 标志 
当前 文件 偏 移 量 






V 节点 表 
v 节 点 信息 








v 节点 指针 — - 






fd 
标志 文件 指针 



















文件 状态 标志 i 节点 信息 
当前 文件 偏 移 量 | / | 当前 文件 长 度 








v 节 点 指针 
图 C-2 open 和 dup 的 结果 

如 果 fd 是 1， 执行 dup2 (fd, 1) 后 返回 1， 但 没有 关闭 文件 描述 符 1 ( 见 3.12 节 )。 调 用 

3 次 dup2 后 ，3 个 描述 符 指向 相同 的 文件 表 项 ， 所 以 不 需要 关闭 描述 符 。 

如 果 fd 为 3， 调 用 3 次 aup2 后 ， 有 4 个 描述 符 指 向 相同 的 文件 表 项 ， 这 种 情况 下 就 需要 

关闭 描述 符 3。 

因为 shell 从 左 到 右 处 理 命令 行 ， 所 以 


./a.out > outfile 2>&1 


首先 设置 标准 输出 到 outfile, 然后 执行 dup 将 标准 输出 复制 到 描述 符 2 (标准 错误 ) E, 
其 结果 是 将 标准 输出 和 标准 错误 设置 为 同一 个 的 文件 ， 即 描述 符 1 和 2 指向 同一 个 文件 表 
项 。 而 对 于 命令 行 


./a.out 2>&1 > outfile 


由 于 首先 执行 sup， 所 以 描述 符 2 成 为 终端 (假设 命令 是 交互 执行 的 )， 标 准 输出 重 定向 到 
outfile。 结 果 是 描述 符 1 指向 outfile 的 文件 表 项 ， 描 述 符 2 指向 终端 的 文件 表 项 。 

这 种 情况 下 ,仍然 可 以 用 lseek 和 read 函数 读 文件 中 任意 一 个 位 置 的 内 容 。 但 是 write 
函数 在 写 数据 之 前 会 自动 将 文件 偏 移 量 设置 为 文件 尾 ， 所 以 写 文 件 时 只 能 从 文件 尾 端 开 始 。 
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4.1 


[908] 4.2 


4.3 


stat 函数 总 是 跟随 符号 链接 ( 见 图 4-170. 所 以 该 程序 决 不 会 显示 文件 类 型 是 “符号 链接 ”。 
例如 ， 正 如 本 书 正文 中 所 示 ，/dev/cdrom 是 /dev/sr0 的 一 个 符号 链接 ， 但 是 stat P 
数 的 结果 只 显示 /dev/cdrom 是 一 个 块 特殊 文件 ， 而 不 报告 它 是 一 个 符号 链接 。 若 符号 链 
接 指向 一 个 不 存在 的 文件 ，stat 会 出 错 返 回 。 

将 关闭 该 文件 的 所 有 访问 权限 。 

$ umask 777 


$ date > temp.foo 


SSeS SSS 1 sar 29 Feb 5 14:06 temp. foo 
下 面 的 命令 显示 了 关闭 用 户 读 权限 时 所 发 生 的 情况 。 


$ data > foo 
$ chmod u-r foo 关闭 用 户 读 权 限 
$ ls -1 foo 验证 文件 的 权限 


4.4 


4.5 


4.7 


4.8 


4.9 


4.10 


4.12 
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=-w-r--r=-= 1 sar 29 Feb 5 14:21 foo 

$ cat foo 读 文件 

cat: foo: Permission denied 

如 果 用 open 或 creat 创建 已 经 存在 的 文件 ， 则 该 文件 的 访问 权限 位 不 变 。 运 行 图 4-9 中 
的 程序 可 以 验证 这 点 。 


$ rm foo bar 删除 文件 

$ data > foo 创建 文件 

$ data > bar 

$ chmod a-r foo bar 关闭 所 有 的 读 权 限 

$ 1s -1 foo bar 验证 其 权限 
-—W--—-————- l ser 29 Feb 5 14:25 bar 
cipes carmina l sar 29 Feb 5 14:25 foo 
$ ./a.out 运行 图 4-9 程序 

$ 1s -1 foo bar 检查 文件 的 权限 和 大 小 
ws 1 sar 0 Feb 5 14:26 bar 
-—W------—- l sar 0 Feb 5 14:26 foo 


可 以 看 出 访问 权限 没有 改变 ， 但 是 文件 被 截断 了 。 

目录 的 长 度 从 来 不 会 是 0， 因为 它 总 是 包含 .和 . .两 项 。 符 号 链接 的 长 度 指 其 路 径 名 包含 的 
字符 数 ， 由 于 路 径 名 中 至 少 有 一 个 字符 ， 所 以 长 度 也 不 为 0。 

当 创建 新 的 core 文件 时 ， 内 核对 其 访问 权限 有 一 个 默认 设置 ， 在 本 例 中 是 rw-r--r--. iX 
一 默认 值 可 能 会 也 可 能 不 会 被 umask 的 值 修改 。shell 对 创建 的 重 定向 的 新 文件 也 有 一 个 默 
认 的 访问 权限 , 本 例 中 为 rw-rw-rw-, 这 个 值 总 是 被 当前 的 umask 修改 , 在 本 例 中 umask 
为 02。 

不 能 使 用 qu 的 原因 是 它 需 要 文件 名 ， 如 

du tempfile 

或 目录 名 ， 如 

du s 


只 有 当 unlink 函数 返回 时 才 释 放 tempfile 的 目录 项 ，du .命令 没有 计算 仍然 被 
tempfile 占用 的 空间 。 本 例 中 只 能 使 用 at 命令 查看 文件 系统 中 实际 可 用 的 空闲 空间 。 

如 果 被 删除 的 链接 不 是 该 文件 的 最 后 一 个 链接 ， 则 不 会 删除 该 文件 。 此 时 ， 文 件 的 状态 更 
改 时间 被 更 新 。 但 是 ， 如 果 被 删除 的 链接 是 最 后 一 个 链接 ， 则 该 文件 将 被 物理 删除 。 这 时 
再 去 更 新 文件 的 状态 更 改 时 间 就 没有 意义 , 因为 包含 文件 所 有 信息 的 i 节点 将 会 随 着 文件 的 
删除 而 被 释放 。 

用 opendir 打开 一 个 目录 后 ， 递 归 调 用 函数 dopath. (Ri opendir 使 用 一 个 文件 描述 
符 ， 并 且 只 有 在 处 理 完 目录 后 才 调 用 closedir 释放 描述 符 ， 这 就 意味 着 每 次 降 一 级 就 要 
使 用 另外 一 个 描述 符 。 所 以 进程 可 打开 的 最 大 描述 符 数 就 限制 了 我 们 可 以 遍历 的 文件 系统 
树 的 深度 。Single UNIX Specification 的 XSI 扩展 中 说 明 的 ftw 允许 调用 者 指定 使 用 的 描述 
符 数 ， 这 隐 含 着 可 以 关闭 描述 符 并 且 重 用 它们 。 

chroot 函数 被 因特网 文件 传输 协议 (Internet File Transfer Protocol, FTP) 程序 用 于 辅助 安 
全 性 。 系 统 中 没有 账户 的 用 户 〈 也 称 为 匿名 FIP) 放 在 一 个 单独 的 目录 下 ， 利 用 chroot 
将 此 目录 当 作 新 的 根 目 录 ， 就 可 以 阻止 用 户 访问 此 目录 以 外 的 文件 。 

chroot 也 用 于 在 另 一 台 机 器 上 构造 一 个 文件 系统 层次 结构 的 副本 , 然后 修改 此 副本 , 不 会 
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4.1 


4.1 


4.1 


4.1 


3 


4A 


5 


CN 





更 改 原来 的 文件 系统 。 这 可 用 于 测试 新 软件 包 的 安装 。 

chroot 只 能 由 超级 用 户 执 行 , 一 旦 更 改 了 一 个 进程 的 根 , 该 进程 及 其 后 代 进 程 就 再 也 不 能 
恢复 至 原先 的 根 。 

首先 调用 stat 函数 取得 文件 的 3 个 时 间 值 ， 然 后 调用 utimes 设置 期 望 的 值 。 在 调用 
utimes 时 我 们 不 希望 改变 的 值 应 当 是 stat 中 相应 的 值 。 

finger(1) 对 邮箱 调用 stat 函数 ， 最 近 一 次 的 修改 时 间 是 上 一 次 接收 邮件 的 时 间 ， 最 近 访 
问 时 间 是 上 一 次 读 邮件 的 时 间 。 

cpio 和 tar 存储 的 只 是 归档 文件 的 修改 时 间 (st_mtim)。 因 为 文件 归档 时 一 定 会 读 它 ， 

所 以 该 文件 的 访问 时 间 对 应 于 创建 归档 文件 的 时 间 , 因此 没有 存储 其 访问 时 间 。cpio 的 -a 
选项 可 以 在 读 输入 文件 后 重新 设置 该 文件 的 访问 时 间 ， 于 是 创建 归档 文件 不 改变 文件 的 访 
问 时 间 。( 但 是 ， 重 置 文件 的 访问 时 间 确 实 改 变 了 状态 更 改 时 间 。) 状态 更 改 时 间 没 有 存储 
在 文 挡 上 ， 因 为 即使 它 曾 被 归档 ， 在 抽取 时 也 不 能 设置 其 值 。(utimes 函数 极其 相关 的 
futimens 和 utimensta 函数 可 以 更 改 的 仅仅 是 访问 时 间 和 修改 时 间 。) 

对 tar 来 说 ， 在 抽取 文件 时 ， 其 默认 方式 是 复原 归档 时 的 修改 时 间 值 ， 但 是 tar 的 -m 选 
项 则 将 修改 时 间 设 置 为 抽取 文件 时 的 时 间 ， 而 不 是 复原 归档 时 的 修改 时 间 值 。 对 于 tar, 

无 论 何 种 情况 ， 在 抽取 后 ， 文 件 的 访问 时 间 均 是 抽取 文件 时 的 时 间 。 

男 一 方面 ，cpio 将 访问 时 间 和 修改 时 间 设 置 为 抽取 文件 时 的 时 间 。 默 认 情况 下 ， 它 并 不 试 
图 将 修改 时 间 设 置 为 归档 时 的 值 。cpio 的 -m 选项 将 文件 的 修改 时 间 和 访问 时 间 设 置 为 归 
档 时 的 值 。 

内 核对 目录 树 的 深度 没有 内 在 的 限制 , 但 是 如 果 路 径 名 的 长 度 超出 了 PATH MAX, 则 有 许多 
命令 会 失败 。 图 C-3 程序 创建 了 一 个 深度 为 1 000 的 目录 树 ， 每 一 级 目录 名 有 45 个 字符 。 

在 所 有 平台 上 我 们 都 能 构建 这 样 的 结构 , 但 并 不 是 在 所 有 平台 上 都 能 用 getcwd 得 到 第 
1000 级 目录 的 绝对 路 径 名 。 在 MacOS X 10.6.8 中 ， 当 到 达 长 路 径 的 目录 尾部 时 ，getcwd 
就 不 再 成 功 了 。 在 FreeBSD 8.0, Linux 3.2.0 和 Solaris 10 中 ，getcwd 可 以 获得 路 径 名 ， 但 
是 需要 多 次 调用 realloc 得 到 一 个 足够 大 的 缓冲 区 。 在 Linux 3.2.0 上 运行 该 程序 后 得 到 : 
$ ./a.out 


getcwd failed, size 
getcwd failed, size 


4096: Numerical result out of range 

4196: Numerical result out of range 
4 Ws T 418 行 

45896: Numerical result out of range 

45996: Numerical result out of range 


getcwd failed, size 
getcwd failed, size 
length = 46004 


显示 46004 字 节 的 路 径 名 
然而 ， 不 能 用 cpio 归档 此 目录 ， 因 为 文件 名 太 长 了 。 事 实 上 ，cpio 在 所 有 4 种 平台 上 都 不 
能 归档 此 目录 。 于 此 对 比 的 是 ， 在 FreeBSD 8.0. Linux 3.2.0 和 Mac OS X 10.6.8 上 ， 可 以 用 
tar 归档 此 目录 。 然 而 ， 在 Linux 3.2.0 上 ， 我 们 不 能 从 归档 文件 中 抽取 出 目录 的 层次 结构 。 


#include "apue.h" 
#include «fcntl.h» 


#define DEPTH 1000 /* directory depth */ 
#define STARTDIR "/tmp" 
#define NAME "alonglonglonglonglonglonglonglonglonglongname" 


#define MAXSZ (10*8192) 


int 
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main(void) 


{ 


int ij 
size t size; 
char *path; 


if (chdir(STARTDIR) < 0) 
err sys("chdir error"); 


for (i = 0; i « DEPTH; i++) { 
if (mkdir(NAME, DIR MODE) < 0) 
err sys("mkdir failed, i = £d", i); 
if (chdir(NAME) « 0) 
err sys("chdir failed, i = $d", i); 


if (creat("afile", FILE MODE) < 0) 
err sys("creat error"); 


/* 
* The deep directory is created, with a file at the leaf. 
* Now let's try to obtain its pathname. 


+ 
path = path alloc(&size); 
Lom ctos qd 
if (getcwd(path, size) != NULL) { 
break; 
) else { 
err ret("getcwd failed, size = $1d", (long)size); 
size += 100; 
if (size » MAXSZ) 
err quit("giving up"); 
if ((path = realloc(path, size)) -- NULL) 
err sys("realloc error"); 
} 
} 
printf ("length = %ld\n%s\n", (long)strlen(path), path); 
exit (0); 
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图 C-3 创建 深 目录 树 


417 /dev 目录 关闭 了 一 般 用 户 的 写 访问 权限 ， 以 防止 普通 用 户 删除 目录 中 的 文件 名 。 这 就 意味 


着 unlink 失败 。 


S 5 di 


5.2 


fgets 函数 读 入 数据 ， 直 到 行 结束 或 缓冲 区 满 (当然 会 留 出 一 个 字 节 存放 终止 null 字 节 


Ja 


同样 ，fputs 只 负责 将 缓冲 区 的 内 容 输出 直到 遇 到 一 个 null 字 节 ， 而 并 不 考虑 缓冲 区 中 是 
否 包含 换行 符 。 所 以 ， 如 果 将 MAXLINE 设 得 很 小 ， 这 两 个 函数 仍然 会 正常 工作 ;只 不 过 在 


缓冲 区 较 大 时 ， 函 数 被 执行 的 次 数 要 多 于 MAXLINE 值 设置 得 较 大 的 时 候 。 
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5.4 
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3:7. 
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如 果 这 些 函 数 删除 或 添加 换行 符 CO gets 和 puts 函数 的 操作 )， 则 必需 保证 对 于 最 长 的 
行 ， 缓 冲 区 也 足够 大 。 

“4 printf 没有 输出 任何 字符 时 ， 如 printf("") ;， 函 数 调 用 返回 0。 

这 是 一 个 比较 常见 的 错误 。getc 以 及 getchar 的 返回 值 是 int 类 型 ,而 不 是 char KM. 
由 于 EOF 经 常 定义 为 一 1, 那么 如 果 系 统 使 用 的 是 有 符号 的 字符 类 型 , 程序 还 可 以 正常 工作 。 
但 如 果 使 用 的 是 无 符号 字符 类 型 ， 那 么 返回 的 EOF 被 保存 到 字符 c 后 将 不 再 是 一 1:， 所 以 ， 
程序 会 进入 死 循 环 。 本 书 说 明 的 4 种 平台 都 使 用 带 符号 字符 ， 所 以 实例 代码 都 能 工作 。 
使 用 方法 为 : 先 调 用 fflush 后 调用 fsync。fsync 所 使 用 的 参数 由 fileno 函数 获得 。 
如 果 不 调 用 fflush,， 所 有 的 数据 仍然 在 内 存 缓冲 区 中 , 此 时 调用 fsync 将 没有 任何 效果 。 
当 程 序 交 互 运行 时 ， 标 准 输入 和 标准 输出 均 为 行 缓冲 方式 。 每 次 调用 fgets 时 标准 输出 设 
备 将 自动 冲洗 。 

基于 BSD 系统 的 fmemopen 的 实现 如 图 C-4 所 示 。 


#include <stdio.h> 
#include <stdlib.h> 
#include <string.h> 


#include <errno.h> 


/* 


* Our internal structure tracking a memory stream 


sz 


struct memstream 


{ 


char *buf; /* in-memory buffer */ 

size_t rsize; /* real size of buffer */ 

size_t vsize; /* virtual size of buffer */ 

size_t curpos; /* current position in buffer */ 

int flags; /* see below */ 
he. 
/* flags */ 
#define MS_READ 0x01 /* open for reading */ 
#define MS WRITE 0x02 /* open for writing */ 
#define MS APPEND 0x04 /* append to stream */ 
#define MS_TRUNCATE 0x08 /* truncate the stream on open */ 
#define MS_MYBUF 0x10 /* free buffer on close */ 


#ifndef MIN 


#define MIN(a, b) ((a) < (b) ? (a) 


*endif 


(b) ) 


static int mstream_read(void *, char *, int); 
static int mstream_write(void *, const char *, int); 


static fpos_t mstream_seek(void *, 
static int mstream_close(void *); 


fpoea t, int)i 


static int type to flags(const char * restrict type); 
static off t find end(char *buf, size t len); 


FILE * 


fmemopen(void * restrict buf, size t size, 
const char * restrict type) 
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struct memstream *ms; 
FILE *fp; 


if (size == 0) 1 
errno - EINVAL; 
return (NULL); 


if ((ms = malloc(sizeof(struct memstream))) - 
errno - ENOMEM; 
return (NULL); 


NULL) { 


if ((ms->flags = type to flags(type)) == 0) { 
errno - EINVAL; 
free (ms); 


return (NULL); 


if (buf == NULL) { 
if ((ms->flags & (MS_READ|MS_WRITE)) != 
(MS_READ|MS_WRITE)) { 
errno = EINVAL; 
free (ms); 
return (NULL); 
} 


if ((ms->buf = malloc(size)) == NULL) { 
errno = ENOMEM; 
free (ms); 


return (NULL); 
) 


ms-»rsize = size; 
ms->flags |= MS MYBUF; 
ms-»curpos = 0; 

) else { 
ms-»buf = buf; 
ms-»rsize - size; 


if (ms->flags & MS APPEND) 
ms-»curpos = find end(ms-»5buf, ms-»rsize); 
else 
ms-»curpos = 0; 
) 
if (ms->flags & MS APPEND) { /* 
ms-»vsize = ms-»curpos; 
) else if (ms->flags & MS TRUNCATE) { /* "w" mode */ 


"a" mode */ 


ms-»vsize - 0; 
) else ( /* "xr" mode */ 
ms-»vsize - size; 


) 


fp = funopen(ms, mstream read, mstream write, 
mstream seek, mstream close); 
if (fp == NULL) { 
if (ms->flags & MS MYBUF) 
free (ms-»buf); 
free (ms); 
} 


return (fp); 
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static int 
type to flags(const char * restrict type) 
{ 

const char *cp; 

int flags = 0; 


for (cp = type; *cp != 0; cp++) { 
switch (*cp) { 


case 'r': 
if (flags != 0) 
return (0); /* error */ 
flags |= MS_READ; 
break; 
case 'w': 
if (flags != 0) 
return(0); /* error */ 
flags |= MS WRITE|MS TRUNCATE; 
break; 
case 'a': 
if (flags != 0) 
return(0); /* error */ 
flags |= MS APPEND; 
break; 
case '*': 
if (flags == 0) 
return (0); /* error */ 
flags |= MS_READ|MS_WRITE; 
break; 
case 'b': 
if (flags == 0) 
return(0); /* error */ 
break; 
default: 
return(0); /* error */ 


915 } 


return(flags); 


static off t 
find end(char *buf, size t len) 


{ 
off t off = 0; 


while (off < len) { 
if (buf[off] == 0) 
break; 
offtt; 
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} 


return (off); 


static int 
mstream_read(void *cookie, char *buf, int len) 
{ 

int nr; 

Struct memstream *ms - cookie; 


if (!(ms->flags & MS READ)) { 
errno = EBADF; 
return (-1); 

} 

if (ms->curpos >= ms->vsize) 
return (0); 


/* can only read from curpos to vsize */ 
nr = MIN(len, ms->vsize - ms->curpos); 
memcpy (buf, ms->buf + ms->curpos, nr); 
ms-»curpos += nr; 

return (nr); 


static int 
mstream write(void *cookie, const char *buf, int len) 
{ 

int nw, off; 

struct memstream *ms = cookie; 


if (!(ms->flags & (MS_APPEND|MS_WRITE))) { 
errno = EBADF; 
return (-1); 
} 
if (ms->flags & MS_APPEND) 
off = ms->vsize; 
else 
off = ms->curpos; 
nw = MIN(len, ms->rsize - off); 
memcpy (ms->buf + off, buf, nw); 
ms->curpos = off + nw; 
if (ms->curpos > ms->vsize) { 
ms->vsize = ms-»curpos; 
if (((ms->flags & (MS READ|MS WRITE)) == 
(MS READ|MS WRITE)) && (ms->vsize < ms-»rsize)) 
*(ms-»buf + ms->vsize) = 0; 
} 
if ((ms->flags & (MS_WRITE|MS_APPEND)) && 
!(ms->flags & MS READ)) { 
if (ms->curpos < ms-»rsize) 
*(ms-»buf + ms-»curpos) = 0; 
else 
*(ms-»buf + ms-»rsize - 1) = 0; 
} 


return (nw); 
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} 


static fpos_t 
mstream_seek(void *cookie, fpos_t pos, int whence) 
{ 

int off; 

struct memstream *ms = cookie; 


switch (whence) { 

case SEEK_SET: 
off = pos; 
break; 

case SEEK_END: 
off = ms->vsize + pos; 
break; 

case SEEK CUR: 
off = ms-»curpos + pos; 
break; 

} 

if (off « 0 || off > ms-»vsize) { 
errno = EINVAL; 
return -1; 

} 

ms-»curpos = off; 

return (off); 


) 


static int 
mstream close(void *cookie) 


{ 


struct memstream *ms = cookie; 


if (ms->flags & MS_MYBUF) 
free (ms-»buf); 

free (ms); 

return(0); 


图 C-4 BSD 系统 的 fmemopen 实现 
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6.1 6.3 节 讲 述 了 在 Linux 和 Solaris 系统 中 访问 阴影 口令 文件 的 函数 。 不 能 使 用 6.2 节 所 述 函 数 
返回 的 pw_passwd 字段 值 与 加 密 口 令 相 比较 ， 因 为 此 字段 不 是 加 密 的 口令 。 正确 的 方法 是 
使 用 阴影 口令 文件 中 对 应 用 户 的 加 密 口令 字段 来 进行 比较 。 
在 FreeBSD fll Mac OS X F, 口令 文件 的 阴影 是 自动 建立 的 。FreeBSD 8.0 中 ， 仅 当 调 用 者 
的 有 效用 户 ID 为 0 时 ,getpwnam 或 getpwuid 函数 返回 的 passed 结构 中 的 pw_passwd 
字段 包含 有 加 密 口 令 。 在 Mac OS X10.6.8 上 ， 加 密 口 令 不 能 通过 这 些 接口 访问 。 

6.2 Ý Linux 3.2.0 和 Solaris 10 中 ， 图 C-5 程序 输出 加 密 口令 。 当 然 ， 除 非 有 超级 用 户 权 限 ， 否 
则 调用 getspnam 将 返回 EACCES 错误 。 


#include "apue.h" 
#include <shadow.h> 
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int 
main (void) /* Linux/Solaris version */ 
{ 

struct spwd  *ptr; 


if ((ptr = getspnam("sar")) -- NULL) 
err sys("getspnam error"); 
printf("sp pwdp = %s\n", ptr->sp_pwdp == NULL || 
ptr->sp_pwdp[0] == 0 ? "(null)" : ptr->sp_pwdp) ; 
exit(0); 


C-5 Æ Linux 和 Solaris 系统 中 输出 加 密 口令 
在 FreeBSD 8.0 中 ， 具 有 超级 用 户 权 限时 ， 图 C-6 程序 将 输出 加 密 口 令 ， 否 则 pw_passed 
的 返回 值 为 星 号 (Œ). 在 Mac OS X 10.6.8 F, 不 管 其 运行 时 的 用 户 权 限 是 什么 都 输出 星 号 。 


#include "apue.h" 
#include <pwd.h> 


int 
main (void) /* FreeBSD/Mac OS X version */ 
{ 

struct passwd *ptr; 

if ((ptr = getpwnam("sar")) == NULL) 


err sys("getpwnam error"); 
printf ("pw passwd = %s\n", ptr->pw_passwd == NULL || 
ptr-»pw passwd[0] == 0? "(null)" : ptr-»pw passwd); 
exit (0); 


| 图 C-6 在 FreeBSD 和 MacOSX 中 输出 加 密 口 令 
65 [E C-7 程序 以 类 似 于 date 命令 的 格式 输出 日 期 。 


#include "apue.h" 
#include <time.h> 


int 
main (void) 


{ 


time_t caltime; 
struct tm *tm; 
char line[MAXLINE]; 
if ((caltime = time(NULL)) == -1) 
err sys("time error"); 
if ((tm = localtime(&caltime)) == NULL) 
err sys("localtime error"); 
if (strftime(line, MAXLINE, "£a %b £d $X $Z %Y\n", tm) == 0) 


err sys("strftime error"); 
fputs(line, stdout); 
exit(0); 





图 C-7 以 date(1) 的 格式 输出 日 期 和 时 间 
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图 C-7 中 程序 的 运行 结果 如 下 : 
$ ./a.out 作者 的 默认 格式 是 美国 东部 
Wed Jul 25 22:58:32 EDT 2012 
$ TZ=US/Mountain ./a.out 美国 山地 时 间 
Wed Jul 25 20:58:32 MDT 2012 
$ TZ-Japan ./a.out 日 本 
Thu Jul 26 11:58:32 JST 2012 

第 7 章 

7.1 ”原因 在 于 printf 的 返回 值 〈 输 出 的 字符 数 ) 变 成 了 main 函数 的 返回 值 。 为 了 验证 这 一 
结论 ， 改 变 打 印字 符 串 的 长 度 ， 然 后 运行 程序 ， 查 看 返回 值 是 否 与 新 的 字符 串 长 度 值 匹 配 。 
当然 ， 并 不 是 所 有 的 系统 都 会 出 现 该 情况 。 还 要 注意 的 是 ， 如 果 在 gcc 中 人 允许 ISO C 扩展 
的 编译 选项 ， 返 回 值 将 总 是 0， 这 是 标准 要 求 的 。 

7.2 “ 当 程 序 处 于 交互 运行 方式 时 ， 标 准 输出 通常 处 于 行 缓冲 方式 ， 所 以 当 输出 换行 符 时 ， 上 次 
的 结果 才 被 真正 输出 。 如 果 标 准 输出 被 定向 到 一 个 文件 ， 而 标准 输出 处 于 全 缓冲 方 式 ， 则 
当 标 准 IO 清理 操作 执行 时 ， 结 果 才 真正 被 输出 。 

7.3 HF agre Ñ argv 的 副本 不 像 environ 一 样 保 存在 全 局 变量 中 ， 所 以 在 大 多 数 UNIX 系 
统 中 没有 其 他 办 法 。 

74 “4 C 程序 解 引用 一 个 空 指针 出 错时 ， 执 行 该 程序 的 进程 将 终止 。 可 以 利用 这 种 方法 终止 
进程 。 

7.5 ”定义 如 下 : 


typedef void  Exitfunc(void); 
int atexit(Exitfunc *func) ; 


7.6 calloc 将 分 配 的 内 存 空间 初始 化 为 0。 但 是 ISO C 并 不 保证 0 值 与 浮 点 0 或 空 指针 的 值 
相同 。 

7.7 ”只 有 通过 exec 函数 执行 一 个 程序 时 ， 才 会 分 配 堆 和 栈 〈 见 8.10 节 )。 

7.8 ”可 执行 文件 (a.out) 包含 了 用 于 调试 core 文件 的 符号 表 信息 。 用 strip(1) 命 令 可 以 市 
除 这 些 信 息 ， 对 两 个 a .out 文件 执行 这 条 命令 ， 它 们 的 大 小 减 为 798760 和 6200 字 节 。 

79 ”没有 使 用 共享 库 时 ， 可 执行 文件 的 大 部 分 都 被 标准 UO 库 所 占用 。 

7.10 这 段 代 码 不 正确 。 因 为 在 自动 变量 val 已 经 不 存在 之 后 ， 代 码 还 通过 指针 引用 这 个 已 经 不 
存在 的 自动 变量 。 自 动 变量 val 在 复合 语句 开始 的 左 花 括号 之 后 声明 了 ， 但 当 该 复合 语句 
结束 时 ， 即 在 匹配 的 右 花 括号 之 后 ， 自 动 变量 就 不 存在 了 。 
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81 ”为 了 仿真 子 进程 终止 时 关闭 标准 输出 的 行为 ， 在 调用 exit 之 前 加 下 列 代码 行 : 


fclose(stdout); 
为 了 观察 其 效果 ， 用 下 面 几 行 代 替 程 序 中 调用 printf 的 语句 。 


i = printf("pid = $1d, glob = %d, var = %d\n", 
(long) getpid(), glob, var); 

sprintf (buf, "$dWMn", i); 

write (STDOUT_FILENO, buf, strlen(buf)); 
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还 需要 定义 变量 i Fil buf. 920 
这 里 假设 子 进程 调用 exit 时 关闭 标准 IO 流 ， 但 不 关闭 文件 描述 符 STDOUT_FILENO。 有 些 
版 本 的 标准 VO 库 会 关闭 与 标准 输出 相关 联 的 文件 描述 符 从 而 引起 write 标准 输出 失败 。 在 这 
种 情况 下 ， 调 用 dup 将 标准 输出 复制 到 另 一 个 描述 符 ，write 则 使 用 新 复制 的 文件 描述 符 。 

82 ”可 以 通过 图 C-8 程序 来 说 明 这 个 问题 。 





#include "apue.h" 
static void fl(void), f2(void); 


int 
main(void) 
{ 
£1(); 
£2(); 
_exit (0); 
} 


static void 
fl (void) 
{ 
pid t pid; 


if ((pid = vfork()) < 0) 
err sys("vfork error"); 
/* child and parent both return */ 
} 


static void 


f2 (void) 

{ 
char buf [1000]; /* automatic variables */ 
int i; 


for (i = 0; i « sizeof(buf); i++) 
buf[i] = 0; 


图 C-8 错误 使 用 vfork 的 例子 


当 函 数 fl 调用 vfork 时 ， 父 进程 的 栈 指针 指向 fl 函数 的 栈 帧 ， 见 图 C-9. vfork 使 得 子 
进程 先 执行 然后 从 £1 返回 , 接着 子 进 程 调 用 £2, 并 且 £2 的 栈 帧 覆盖 了 fl 的 栈 帧 ， 在 £2 
中 子 进程 将 自动 变量 buf 的 值 置 为 0， 即将 栈 中 的 1 000 个 字 节 的 值 都 置 为 0。 从 £2 返回 
后 子 进程 调用 _exit， 这 时 栈 中 main 栈 帧 以 下 的 内 容 已 经 被 f2 修改 了 。 然 后 ， 父 进程 从 
vfork 调用 后 恢复 继续 ,并 从 fl 返回 。 返回 信息 虽然 常常 保存 在 栈 中 , 但 是 多 半 可 能 已 经 
被 子 进程 修改 了 。 对 于 这 个 例子 ， 父 进程 恢复 继续 执行 的 结果 要 依赖 于 你 所 使 用 的 UNIX 
系统 的 实现 特征 〈 如 返回 信息 保存 在 栈 帧 中 的 具体 位 置 、 修 改动 态 变量 时 覆盖 了 哪些 信息 
等 )。 通 常 的 结果 是 一 个 core 文件 ， 但 在 你 的 系统 中 ， 产 生 的 结果 可 能 不 同 。 

84 ”在 图 8-13 P, 我 们 先 让 父 进程 输出 , 但 是 当 父 进程 输出 完毕 子 进程 要 输出 时 , 要 让 父 进程 终止 。 
是 父 进程 先 终止 还 是 子 进程 先 执行 输出 ， 要 依赖 于 内 核对 两 个 进程 的 调度 〈 另 一 个 竞争 条 件 )。 


922 


744 附录 C 部 分 习题 答案 








在 父 进程 终止 后 ，shell 会 开始 执行 下 一 个 程序 ， 它 也 许 会 干扰 子 进程 的 输出 。 为 了 避免 这 种 情 
况 ， 要 在 子 进程 完成 输出 后 才 终 止 父 进程 。 用 下 面 的 语句 替换 程序 中 fork 后 面 的 代码 。 


else if (pid == 0) { 


WAIT PARENT () ; /* parent goes first */ 

charatatime ("output from child\n"); 

TELL PARENT (getppid()); /* tell parent we're done */ 
) else { 

charatatime ("output from parent\n"); 

TELL_CHILD (pid); /* tell child we're done */ 

WAIT_CHILD(); /* wait for child to finish */ 
} 

栈 的 底部 





nore 


图 C-9 调用 vfork 时 的 栈 帧 
由 于 只 有 终止 父 进 程 才能 开始 下 一 个 程序 ， 而 该 程序 让 子 进程 先 运 行 ， 所 以 不 会 出 现 上 面 
的 情况 。 
85 对 argv[2]1 打 印 的 是 相同 的 值 (/home/sar/bin/testinterp)。 原 因 是 execlp 在 结 
束 时 调用 了 execve， 并 且 与 直接 调用 exec] 的 路 径 名 相同 。 回 忆 图 8-15。 
&6 ”图 C-10 程序 创建 了 一 个 僵 死 进程 。 


#include "apue.h" 





#ifdef SOLARIS 


#define PSCMD "ps -a -o pid,ppid,s,tty,comm" 
#else 

#define PSCMD "ps -o pid,ppid, state, tty, command" 
#tendif 

int 


main (void) 
{ 
pid_t pid; 


if ((pid = fork()) < 0) 
err_sys("fork error"); 

else if (pid == 0) /* child */ 
exit (0); 


/* parent */ 
sleep (4); 
system (PSCMD) ; 


exit (0); 








C-10 创建 一 个 僵 死 进程 并 用 ps 查看 其 状态 
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执行 程序 结果 如 下 (ps(1) 用 z 表示 伪 死 进程 ): 


$ ./a.out 
PID PPID S TT COMMAND 
2369 2208 S pts/2 -bash 
7230 2369 S pts/2 -/a.out 
7231 7230 Z pts/2 [a.out] <defunct> 
7232 7230 S pts/2 sh -c ps -o pid,ppid,state,tty, command 
7233 7232 R pts/2 ps -o pid,ppid,state,tty,command 
第 9 章 
9.1 ”因为 init 是 登录 shell 的 父 进 程 , 当 登 录 shell 终止 时 它 收 到 SIGCHLD 信号 量 , 所 以 init 
进程 知道 什么 时 候 终 端 用 户 注销 。 
网 络 登录 没有 包含 init， 在 utmp 和 wtmp 文件 中 的 登录 项 和 相应 的 注销 项 是 由 一 个 处 理 
登录 并 检测 注销 的 进程 写 的 (本 例 中 为 telnetd). 923 
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10.1 当 程 序 第 一 次 接收 到 发 送 给 它 的 信号 时 就 终止 了 。 因 为 一 捕捉 到 信号 ，pause 函数 就 返回 。 
10.2 fbi XA C-11. 























处 理 处 理 longjmp 
SIGINT SIGALRM 
栈 的 底部 ] l | 
main main main 
的 栈 帧 的 栈 帧 fp Bei 
| sleep2 sleep2 
的 栈 帧 的 栈 帧 
sig_int A 
的 栈 帧 的 栈 帧 
longjmp 
sig alrm 
的 栈 帧 








图 C-11 long jmp 前 后 的 栈 帧 

在 sig alrm 中 通过 1ongjmp 返回 sleep2， 有 效 地 避免 了 继续 执行 sig_int。 从 这 一 
点 ，sleep2 返回 main (回忆 图 10-85. 

10.4 在 第 一 次 调用 alarm 和 setjmp 之 间 又 有 一 次 竞争 条 件 。 如 果 进 程 在 调用 alarm 和 
setjmp 之 间 被 内 核 阻 塞 了 ， 闸 钟 时 间 超 过 后 就 调用 信号 处 理 程序 ， 然 后 调用 1ongjmp。 
但 是 由 于 没有 调用 过 setjmp. 所 以 没有 设置 env_alrm 缓冲 区 。 如 果 longjmp 的 跳 转 组 
冲 区 没有 被 setjmp 初始 化 ， 则 说 明 Longjmp 的 操作 是 未 定义 的 。 

10.5 参见 Don Libes 的 论文 “Implementing Software Timers”(C users Journal, Vol. 8, no. 11, Nov. 
1990) 中 的 例子 。 可 以 访问 http:// www.kohala.com/start/ libes.timers.txt 
获得 该 论文 的 电子 版 。 
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10.7 
10.8 
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如 果 仅 仅 调 用 _exit， 则 进程 终止 状态 不 能 表示 该 进程 是 由 于 SIGABRT 信号 而 终止 的 。 
如 果 信 号 是 由 其 他 用 户 的 进程 发 出 的 , 进程 必须 设置 用 户 ID 为 根 或 者 是 接收 进程 的 所 有 者 ， 
否则 kill 不 能 执行 。 所 以 实际 用 户 ID 为 信号 的 接收 者 提供 了 更 多 的 信息 。 


10.10 对 于 本 书 作 者 所 用 的 一 个 系统 ,每 60 一 90 分 钟 增加 一 秒 ， 这 个 误差 是 因为 每 次 调用 sleep 


都 要 调度 一 次 将 来 的 时 间 事 件 , 但 是 由 于 CPU 调度 , 有 时 并 没有 在 事件 发 生 时 立即 被 唤醒 。 
另外 一 个 原因 是 进程 开始 运行 和 再 次 调用 sleep 都 需要 一 定量 的 时 间 。 

cron 守护 进程 这 样 的 程序 每 分 钟 都 要 获取 当前 时 间 ， 它 首先 设置 一 个 休眠 周期 ， 然 后 在 下 
一 分 钟 开 始 时 唤醒 。( 将 当前 时 间 转 换 成 本 地 时 间 并 查看 tm sec 值 . ) 每 一 分 钟 ， 设 置 下 
一 个 休眠 周期 ， 使 得 在 下 一 分 钟 开 始 时 可 以 唤醒 。 大 多 数 调用 是 sleep (60) ， 偶 尔 有 一 个 
sleep (59) 用 于 在 下 一 分 钟 同步 。 但 是 ， 若 在 进程 中 花费 了 许多 时 间 执 行 命令 或 者 系统 的 
负载 重 、 调 度 慢 ， 这 时 休眠 值 可 能 远 小 于 60。 


10.11 在 Linux 3.2.0. Mac OS X 10.6.8 和 Solaris 10 中 ， 从 来 没有 调用 过 stexrsz 的 信号 处 理 程 


序 ， 一 旦 文件 的 大 小 达到 1024 时 ，write 就 返回 24。 

在 FreeBSD 8.0 中 ， 当 文件 大 小 已 达到 1000 字 节 ， 在 下 一 次 准备 写 100 字 节 时 调用 该 信号 
处 理 程序 ，write 返回 一 1， 并 且 将 errno RAW EFBIG (文件 太 大 )。 

在 所 有 4 种 平台 上 ， 如 果 在 当前 文件 偏 移 量 处 (文件 尾 端 〉 尝试 再 一 次 write， 将 收 到 
SIGXFSZ 信号 ，write 将 失败 ， 返 回 -1， 并 将 errno 设置 为 EFBIG。 


10.12 结果 依赖 于 标准 VO 库 的 实现 : fwrite 函数 如 何 处 理 一 个 被 中 断 的 write. 


例如 ， 在 Linux 3.2.0 上 ， 当 使 用 fwrite 函数 写 一 个 大 的 缓冲 区 时 ，fwrite 以 相同 的 字 
节 数 直接 调用 write。 在 write 系统 调用 当中 ， 闹 钟 时 间 到 ， 但 我 们 直到 写 结束 才 看 到 信 
号 。 看 上 去 就 好 像 在 write 系统 调用 进行 当中 内 核 阻塞 了 信号。 

与 此 不 同 的 是 ， 在 Solaris 10 中 ，fwrite 函数 调用 以 8 KB 的 增 量 调用 write， 直 到 写 完 
PERS HR. SES), SRS), PRT write 回 到 fwrite。 当 从 信号 处 
理 程 序 返 回 时 ， 返 回 到 fwrite 函数 内 部 的 循环 ， 并 继续 以 8 KB 的 增 量 写 。 
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#inc 
finc 


stru 
E 
void 


prin 


{ 


图 C-12 给 出 了 一 个 没有 使 用 自动 变量 ， 而 采用 动态 内 存 分 配 的 程序 。 


lude "apue.h" 
lude «pthread.h» 


ct foo { 
int. a; b, G, d; 


tfoo(const char *s, const struct foo *fp) 


fputs(s, stdout); 

printf(" structure at Ox$1xWMn", (unsigned long) fp); 
printf(" foo.a = $dWMn", fp->a); 

printf(" foo.b = &dWMn", fp->b); 

printf(" foo.c = %d\n", fp->c); 

printf(" foo.d = %d\n", fp->d); 
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void * 


thr_ 


{ 


} 


int 


fnl(void *arg) 
struct foo *fp; 


if ((fp = malloc(sizeof(struct foo))) == NULL) 
err sys("can't allocate memory"); 

fp->a = 1 

fp->b = 2; 

fp->c = 3 

fp->d = 4; 

printfoo("thread:\n", fp); 

return((void *)fp); 


main (void) 


{ 


11.2 


11.3 


11.4 


int err; 
pthread_t tidl; 
struct foo *fp; 


err = pthread create(&tidl, NULL, thr fnl, NULL); 
if (err != 0) 

err exit(err, "can't create thread 1"); 
err - pthread join(tidl, (void *)&fp); 
if (err != 0) 

err exit(err, "can't join with thread 1"); 
printfoo("parent: Mn", fp); 
exit(0); 


图 C-12 ”线程 返回 值 的 正确 使 用 

要 改变 挂 起 作业 的 线程 DDD， 必须 持 有 写 模 式 下 的 读 写 锁 , 防止 ID 在 改变 过 程 中 有 其 他 线程 
在 搜索 该 列表 。 目 前 定义 该 接口 的 方式 存在 的 问题 在 于 : 调用 job find 找到 该 作业 以 及 
调用 job remove 从 列表 中 删除 该 作业 这 两 个 时 间 之 间作 业 ID 可 以 改动 。 这 个 问题 可 以 通 
过 在 job 结构 中 贬 入 引用 计数 和 互 斥 量 ， 然 后 让 job_find 增加 引用 计数 的 方法 来 解决 。 
这 样 修改 ID 的 代码 就 可 以 避免 对 列表 中 非 零 引 用 计数 的 任何 作业 进行 ID 改动 的 情况 。 
首先 ， 列 表 是 由 读 写 锁 保 护 的 ， 但 条 件 变量 需要 互 斥 量 对 条 件 进 行 保 护 。 其 次 ， 每 个 线程 
等 待 满足 的 条 件 应 该 是 有 某 个 作业 进行 处 理 时 需要 的 条 件 ， 所 以 需要 创建 每 线程 数据 结构 
来 表示 这 个 条 件 。 或 者 ， 可 以 把 互 斥 量 和 条 件 变 量 典 入 到 queue 结构 中 ， 但 这 意味 着 所 有 
的 工作 线程 将 等 待 相同 的 条 件 。 如 果 有 很 多 工作 线程 存在 ， 当 唤醒 了 许多 线程 但 又 没有 工 
作 可 做 时 ， 就 可 能 出 现 惊 群 效应 问题 ， 最 后 导致 CPU 资源 的 浪费 ， 并 且 增 加 了 锁 的 争夺 。 
这 根据 具体 情况 而 定 。 总 的 来 说 ， 两 种 情况 都 可 能 是 正确 的 ， 但 每 一 种 方法 都 有 不 足 之 处 。 
在 第 一 种 情况 下 ， 等 待 线程 会 被 安排 在 调用 pthread_cond_broadcast 之 后 运行 。 如 果 
程序 运行 在 多 处 理 器 上 ， 由 于 还 持 有 互 斥 锁 (pthread_cond_wait 返回 持 有 的 互 斥 锁 )， 
一 些 线程 就 会 运行 而 且 马 上 阻塞 。 在 第 二 种 情况 下 ， 运 行 线程 可 以 在 第 3 步 和 第 4 步 之 间 
获取 互 斥 锁 , 然后 使 条 件 失效 , 最 后 释放 互 斥 锁 。 接 着 , 当 调用 pthread_cond_broadcast 
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时 ， 条 件 不 再 为 真 ， 线 程 无 需 运 行 。 这 就 是 为 什么 唤醒 线程 必须 重新 检查 条 件 ， 不 能 仅仅 
因为 pthread_cond wait 返回 就 假定 条 件 就 为 真 。 
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12.3 


12.4 


12.5 
12.6 


就 像 人 们 首先 会 猜 到 的 , 这 并 不 是 一 个 多 线程 问题 .这 些 标准 IO 例 程 事实 上 是 线程 安全 的 。 
我 们 调用 fork 时 ， 每 个 进程 获得 了 标准 VO 数据 结构 的 一 份 副本 。 程 序 运 行 时 把 标准 输出 定 
向 到 终端 时 ， 输 出 是 行 缓冲 的 ， 所 以 每 次 打印 一 行 时 ， 标 准 IO 库 就 把 该 行 写 到 终端 上 。 但 是 ， 
如 果 把 标准 输出 重 定向 到 文件 的 话 ， 则 标准 输出 就 是 全 缓冲 的 。 当 缓冲 区 满 或 者 进程 关闭 流 时 ， 
输出 才 会 写 到 文件 。 在 这 个 例子 中 ， 执 行 fork 时 ， 缓 冲 区 中 包含 了 还 未 写 的 几 个 打印 行 ， 所 
以 当 父 进程 和 子 进程 最 终 冲 洗 缓 冲 区 中 的 副本 时 ， 最 初 的 复制 内 容 就 会 写 入 文件 。 
理论 上 来 讲 ， 如 果 在 信和 号 处 理 程序 运行 时 阻塞 所 有 的 信号 ， 那 么 就 能 使 函数 成 为 异步 信和 号 
安全 的 。 问 题 是 我 们 并 不 能 知道 调用 的 某 个 函数 可 能 并 没有 屏蔽 已 经 被 阻塞 的 信号 ， 这 样 
通过 另 一 个 信号 处 理 程序 可 能 会 使 该 函数 变 成 可 重 入 的 。 

在 FreeBSD 8.0 上 ， 程 序 抛 出 core。 用 gdb 的 话 ， 可 以 看 到 程序 初始 化 过 程 将 调用 线程 函数 ， 这 
些 函数 调用 getenv 找到 环境 变量 LIBPTHREAD SPINLOOPS 和 LIBPTHREAD YIELDLOOPS 
的 值 。 然 而 ， 我 们 的 线程 安全 版 本 的 getenv 回调 pthread 库 函 数 会 处 于 一 种 中 间 的 不 一 致 状 
态 。 另 外 ， 线 程 初 始 化 函数 会 调用 malloc, JffE malloc 中 调用 getenv 来 查找 环境 变量 
MALLOC_OPTIONS 的 值 。 

为 了 避 开 这 个 问题 ， 我 们 可 以 合理 假定 程序 启动 是 单线 程 的 ， 并 使 用 一 个 标志 来 指示 线程 初 
始 化 已 经 通过 我 们 的 getenv 来 完成 了 。 但 这 个 标志 为 假 时 ， 我 们 版 本 的 getenv 会 和 不 可 
重 入 版 本 一 样 操作 (并 且 和 避免 调用 任何 pthread 函数 和 malloc)。 然 后 我 们 提供 一 个 独立 
的 初始 化 函数 来 调用 pthread_once， 而 非 从 getenv 里 面 来 调用 它 。 这 就 要 求 在 调用 
getenv 之 前 程序 调用 我 们 的 初始 化 函数 。 这 就 解决 了 我 们 的 问题 ， 因 为 只 有 程序 启动 初始 化 
完成 后 才能 进行 。 当 程序 调用 了 我 们 的 初始 化 函数 后 ， 这 个 版 本 的 getenv 就 是 线程 安全 的 。 
如 果 希 望 在 一 个 程序 中 运行 另 一 个 程序 ， 还 需要 fork 〈 即 在 调用 exec 之 前 )。 

图 C-13 给 出 了 使 用 select 实现 线程 安全 的 sleep 函数 ， 延 迟 一 定数 量 的 时 间 。 它 是 线程 安 
全 的 ， 因 为 它 并 不 使 用 任何 未 经 保护 的 全 局 或 静态 数据 ， 并 且 只 调用 其 他 线程 安全 的 函数 。 


#include <unistd.h> 
#include <time.h> 
#include <sys/select.h> 


unsigned 
sleep(unsigned seconds) 


{ 


int n; 

unsigned slept; 
time_t start, end; 
struct timeval tv; 


tv.tv_sec = seconds; 

tv.tv_usec = 0; 

time (&start) ; 

n = select(0, NULL, NULL, NULL, &tv); 
if (n == 0) 
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return (0); 
time (&end) ; 
slept = end - start; 
if (slept >= seconds) 
return (0); 
return(seconds - slept); 


C-13 sleep 的 线程 安全 实现 


12.7 很 多 时 候 条 件 变 量 的 实现 都 使 用 互 斥 锁 来 保护 它 的 内 部 结构 。 由 于 这 是 实现 细节 ， 因 而 通 


常 是 被 隐藏 起 来 的 , 所 以 在 fork 处 理 程 序 中 没有 可 移植 的 方法 获取 或 释放 锁 。 既 然 在 调用 
fork 后 并 不 能 确定 条 件 变量 中 的 内 部 锁 状 态 ， 所 以 在 子 进程 中 使 用 条 件 变 量 是 不 安全 的 。 


第 13 3€ 
13.1 如 果 进 程 调 用 chroot, 它 就 不 能 打开 /dev/1log。 解 决 的 办 法 是 , 守护 进程 在 调用 chroot 


之 前 调用 选项 为 LOG_NDELAY 的 open1log。 它 打开 特殊 设备 文件 (UNIX 域 数据 报 套 接 字 ) 
并 生成 一 个 描述 符 ， 即 使 调用 了 chroot 之 后 ， 该 描述 符 仍然 是 有 效 的 。 这 种 场景 在 诸如 
ftpd (文件 传输 协议 守护 进程 ) 这 样 的 守护 进程 中 出 现 ， 为 了 安全 起 见 ， 专 门 调 用 了 
chroot， 但 仍 需要 调用 syslog 来 对 出 错 条 件 记 录 日 志 。 


134 图 C-14 展示 了 一 种 解决 方案 。 


#include "apue.h" 


main (void) 


FILE *fp; 
char *p; 


daemonize ("getlog") ; 
P = getlogin(); 
fp = fopen("/tmp/getlog.out", "w"); 
if (fp != NULL) { 
if (p == NULL) 
fprintf(fp, "no login name\n"); 
else 
fprintf(fp, "login name: %s\n", p); 
} 
exit (0); 


图 C-14 调用 daemonize 然后 获得 登录 名 
其 结果 依赖 于 不 同 的 系统 实现 。dqaemonize 关闭 所 有 打开 文件 描述 符 , 然后 向 /dev/null 
再 打开 前 3 个 。 这 意味 着 进程 不 再 有 控制 终端 ， 所 以 getlogin 不 能 在 utmp 文件 中 看 到 
进程 的 登录 项 。 于 是 在 Linux 3.2.0 和 Solaris 10 中 ， 我 们 发 现 守护 进程 没有 登录 名 。 
但 是 在 FreeBSD 8.0 和 Mac OS X 10.6.8 中 ， 登 录 名 是 由 进程 表 维护 的 ， 并 且 在 执行 fork 
时 复制 。 也 就 是 说 ， 除 非 其 父 进程 没有 登录 名 (如 系统 自 引 导 时 调用 init)， 否 则 进程 总 
能 获得 其 登录 名 。 
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514 X 
14.1 测试 程序 如 图 C-15 Aras. 


#include "apue.h" 
#include «fcntl.h» 
#include <errno.h> 


void 

sigint (int signo) 
{ 

) 


int 

main(void) 

{ 
pid_t pidl, pid2, pid3; 
int fd; 


setbuf (stdout, NULL); 
signal_intr(SIGINT, sigint); 


/* 

* Create a file. 

27 

if ((fd = open("lockfile", O_RDWR|O_CREAT, 0666)) < 0) 
err_sys ("can't open/create lockfile"); 


/* 

* Read-lock the file. 

ay 

if ((pidl = fork()) < 0) { 
err_sys ("fork failed"); 

} else if (pidl == 0) { /* child */ 
if (lock_reg(fd, F_SETLK, F_RDLCK, 0, SEEK_SET, 0) 

err_sys("child 1: can't read-lock file"); 

printf ("child 1: obtained read lock on file\n"); 
pause(); 
printf ("child 1: exit after pause\n"); 


exit (0); 
} else { /* parent */ 
sleep(2); 
} 
/* 
* Parent continues ... read-lock the file again. 
* 


if ((pid2 = fork()) < 0) { 
err sys("fork failed"); 
) else if (pid2 -- O) ( /* chiid */ 
if (lock reg(fd, F SETLK, F RDLCK, 0, SEEK SET, 0) 
err sys("child 2: can't read-lock file"); 
printf("child 2: obtained read lock on file\n"); 
pause(); 


« 0) 


« 0) 
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printf ("child 2: exit after pause\n"); 


exit (0); 
} else { /* parent */ 
sleep (2); 
} 
/* 
* Parent continues ... block while trying to write-lock 
* the file. 
wi À 


if ((pid3 = fork()) < 0) { 
err_sys("fork failed"); 
} else if (pid3 == 0) { /* child */ 
if (lock_reg(fd, F_SETLK, F_WRLCK, 0, SEEK_SET, 0) < 0) 
printf ("child 3: can't set write lock: %s\n", 
strerror(errno)); 
printf("child 3 about to block in write-lock...\n"); 
if (lock reg(fd, F SETLKW, F WRLCK, 0, SEEK SET, 0) < 0) 
err sys("child 3: can't write-lock file"); 
printf("child 3 returned and got write lock????\n"); 


pause(); 
printf("child 3: exit after pause\n"); 
exit(0); 
) else { /* parent */ 
sleep(2); 


/* 
* See if a pending write lock will block the next 
* read-lock attempt. 
rA 
if (lock reg(fd, F SETLK, F RDLCK, 0, SEEK SET, 0) < 0) 
printf("parent: can't set read lock: %s\n", 
strerror(errno)); 
else 
printf("parent: obtained additional read lock while" 
" write lock is pending Win"); 
printf("killing child 1:..\n"); 
kill(pidl, SIGINT); 
printf("killing child 2...Nn"); 
kill(pid2, SIGINT); 
printf("killing child 3... Xn"); 
kill(pid3, SIGINT); 
exit(0); 





图 C-15 ”判断 记录 锁 的 行为 
在 FreeBSD 8.0. Linux 3.2.0 和 Mac OS X 10.6.8 上 ， 记 录 锁 的 行为 是 相同 的 ， 后 增加 的 读者 
可 使 未 决 的 写 者 不 断 等 待 。 运 行 该 程序 得 到 


child 1: obtained read lock on file 

child 2: obtained read lock on file 

child 3: can't set write lock: Resource temporarily unavailable 
child 3 about to block in write-lock... 

parent: obtained additional read lock while write lock is pending 
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14.2 


14.3 


14. 


A 


14.5 


killing child 1... 

child 1: exit after pause 

killing child 2... 

child 2: exit after pause 

killing child 3... 

child 3: can't write-lock file: Interrupted system call 


大 多 数 系统 将 数据 类 型 £a set 定义 为 只 包含 一 个 成 员 的 结构 ， 该 成 员 为 一 个 长 整 型 数组 。 
数组 中 每 一 位 (bit) 对 应 于 一 个 描述 符 。4 个 FD_ 宏 通过 开 、 关 或 测试 指定 的 位 对 这 个 数组 
进行 操作 。 

将 之 定义 为 一 个 包含 数组 的 结构 而 不 仅仅 是 一 个 数组 的 原因 是 : 通过 C 语言 的 赋值 语句 ， 
可 以 使 fd set 类 型 的 变量 相互 赋值 。 

大 多 数 系统 允许 用 户 在 包括 头 文件 <sys/select.h> 前 定义 常量 FD_SETSIZE。 例 如 ， 我 
们 可 以 写 下 面 这 样 的 代码 来 定义 £d set 数据 类 型 ， 使 其 可 以 包含 2 048 个 描述 符 : 


#define FD SETSIZE 2048 
#include <sys/select.h> 


遗憾 的 是 ， 事 情 并 非 如 此 简单 。 为 了 在 现代 系统 使 用 该 技术 ， 我 们 需要 做 以 下 几 件 事情 。 
(1) 在 包含 任何 头 文件 之 前 ， 我 们 需要 定义 哪 种 符号 来 防止 包含 <sys/select.h>。 
一 些 系统 会 使 用 一 个 单独 的 符号 来 保护 fa sec 类 型 的 定义 ， 我 们 也 需要 如 此 定义 。 
例如 , YE FreeBSD 8.0 F, 我 们 需要 定义 _SYS_SELECT_H 来 防止 包含 <sys/select.h>， 
定义 _FD_SET 来 防止 包含 fd set 数据 类 型 的 定义 。 
(2) 有 时 ， 为 了 和 旧 应 用 程序 兼容 ，<sys/types.h> 定 义 了 fd set 的 大 小 ， 所 以 我 们 
必须 首先 包含 它 ， 然 后 去 掉 FD_SETSIZE 的 定义 。 注 意 ， 一 些 系统 用 _FD_SETSIZE 来 代替 。 
(3) 想 能 够 使 用 select 时 ， 我 们 需要 重新 定义 FD SETSIZE (HÀ FD SETSIZE) 
来 最 大 化 文件 描述 符 的 数量 。 
(4) 我 们 需要 取消 定义 第 一 步 定 义 的 符号 。 
(5) 最 终 ， 我 们 能 够 包含 <sys/select.h>。 
在 运行 程序 之 前 ， 我 们 需要 配置 系统 允许 我 们 打开 所 需 的 文件 描述 符 数 量 ， 这 样 我 们 能 够 
实际 利用 的 文件 描述 符 数 量 达到 FD. SETSIZE T. 
下 面 列 出 了 功能 类 似 的 函数 。 
FD_ZERO sigemptyset 
FD_SET sigaddset 


FD_CLR sigdelset 


FD ISSET Sigismember 





没有 与 sigfillset 对 应 的 FD_xxx 函数 。 对 信和 号 量 集 来 说 ， 指 向 信号 量 集 的 指针 总 是 第 
一 个 参数 ， 信 和 号 编号 是 第 二 个 参数 。 对 于 描述 符 来 说 ， 描 述 符 编号 是 第 一 个 参数 ， 指 向 描 
述 符 集 的 指针 是 第 二 个 参数 。 

利用 select 实现 的 程序 见 图 C-16。 


#include "apue.h" 
#include <sys/select.h> 


void 


sleep_us(unsigned int nusecs) 
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struct timeval tval; 


tval.tv_sec = nusecs / 1000000; 
tval.tv_usec = nusecs % 1000000; 
select(0, NULL, NULL, NULL, &tval); 








图 C-16 用 select 实现 sleep us 函数 
利用 poll 实现 的 程序 见 图 C-17。 


#include <poll.h> 





void 
sleep_us(unsigned int nusecs) 
{ 
struct pollfd dummy ; 
int timeout; 


if ((timeout = nusecs / 1000) <= 0) 
1; 
poll(&dummy, 0, timeout); 


li 


timeout 


图 C-17 Hi poll 实现 sleep us 函数 


如 BSD usleep(3) 手 册页 中 所 说 明 的 ，usleep 使 用 nanosleep 函数 ， 该 函数 没有 与 调 
用 进程 设置 的 定时 器 交互 。 

14.6 不 行 。 我 们 可 以 使 TELL_WAIT 创建 一 个 临时 文件 ， 其 中 1 个 字 节 用 做 父 进程 的 锁 ， 另 外 1 
个 字 节 用 做 子 进程 的 锁 。wAIT_CHILD 使 得 父 进 程 等 待 获取 子 进程 字 节 上 的 锁 ， 
TELL PARENT 使 得 子 进程 释放 子 进程 字 节 上 的 锁 。 但 是 问题 在 于 ， 调 用 fork 会 释放 所 有 
子 进程 中 的 锁 ， 使 得 子 进程 开始 运行 时 不 具有 任何 它 自己 的 锁 。 

14.7 图 C-18 中 示 出 了 一 种 解决 方法 。 


#include "apue.h" 
#include «fcntl.h» 


int 

main (void) 

{ 
int i, n; 
int £f4d[2]4 


if (pipe(fd) < 0) 
err Sys("pipe error"); 
set fl(fd[1], O NONBLOCK); 


/* write 1 byte at a time until pipe is full */ 
for (n0; 7 nF) ( 
if ((i = write(fd[1], "a", Ty t= Uy ( 
printf("write ret $d, ", i); 
break; 
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printf("pipe capacity = %d\n", n); 
exit (0); 


图 C-18 用 非 阻塞 写 计算 管道 的 容量 
下 表 列 出 了 在 本 书 所 述 的 4 种 平台 上 计算 出 来 的 值 。 


FreeBSD 8.0 65 536 

Linux 3.2.0 65 536 

Mac OS X 10.6.8 16 384 

Solaris 10 16 384 
这 些 值 可 能 与 对 应 的 PIPE_BUF 值 不 同 ， 其 原因 是 ，PIPE_BUF 被 定义 为 可 被 自动 原子 地 
写 至 一 个 管道 的 最 大 数据 量 。 这 里 ， 我 们 计算 的 是 一 个 管道 独立 于 任何 原子 性 限制 可 保持 
的 数据 量 。 

14.10 图 14-27 中 的 程序 是 否 更 新 输入 文件 的 上 一 次 访问 时 间 依 赖 于 操作 系统 以 及 文件 所 属 的 文 
件 系统 的 类 型 。 在 所 有 4 种 平台 中 ， 当 文件 具有 给 定 操作 系统 默认 的 文件 系统 类 型 ， 上 一 
次 访问 时 间 就 会 更 新 。 






第 15 章 
15.1 如 果 管 道 的 写 端 总 是 不 关闭 ， 则 读者 就 决 不 会 看 到 文件 结束 符 。 分 页 程序 就 会 一 直 阻塞 在 
读 标准 输入 。 


15.2 父 进程 向 管道 写 完 最 后 一 行 以 后 就 终止 ， 当 父 进程 终止 时 管道 的 读 端 自动 关闭 。 但 是 由 于 
子 进程 (分 页 程序 ) 要 等 待 输 出 的 页 ， 所 以 父 进程 可 能 比 子 进程 领先 一 个 管道 缓冲 区 。 如 
果 正 在 运行 的 是 一 个 可 对 命令 行进 行 编辑 的 交互 式 shell， 如 Korn shell， 那 么 当 父 进程 终止 
时 ，shell 多 半 会 改变 终端 的 模式 并 打印 一 个 提示 。 这 个 无 疑 会 影响 已 经 对 终端 模式 进行 修 
改 的 分 页 程序 (由 于 大 部 分 分 页 程序 在 等 待 处 理 下 一 个 页 面 时 将 终端 置 为 非 正 规模 式 )。 

15.3 因为 执行 了 shell， 所 以 popen 返回 一 个 文件 指针 。 但 是 shell 不 能 执行 不 存在 的 命令 ， 
此 在 标准 错误 上 打印 下 面 信息 后 终止 : 


sh: line 1: ./a.out: No such file or directory 


其 退出 状态 为 127 (该 值 取决 于 shell 的 类 型 )。pclose 返回 该 命令 的 终止 状态 ， 这 如 同 从 
waitpid 返回 一 样 。 

15.4 当 父 进程 终止 时 ,用 shell 看 它 的 终止 状态 ,对 于 Bourne shell, Bourne-again shell 和 Korn shell, 
所 用 的 命令 是 echo $?， 打 印 的 结果 是 128 加 信号 编号 。 

15.5 首先 加 入 下 面 的 声明 : 
FILE *fpin, *fpout; 
然后 用 Edopen 关联 管道 描述 符 和 标准 LO Jit, 并 将 流 设 置 为 行 缓冲 的 。 在 从 标准 输入 读 的 
while 循环 之 前 做 此 工作 。 


if ((fpin = fdopen(fd2[0], "r")) == NULL) 
err_sys("fdopen error"); 
if ((fpout = fdopen(fdl[1], "w")) == NULL) 


err_sys("fdopen error"); 
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if (setvbuf(fpin, NULL, _IOLBF, 0) < 0) 
err_sys("setvbuf error"); 

if (setvbuf(fpout, NULL, _IOLBF, 0) < 0) 
err sys("setvbuf error"); 


while 循环 中 的 write 和 read 用 下 面 的 语句 代替 : 


if (fputs(line, fpout) == EOF) 
err_sys("fputs error to pipe"); 

if (fgets(line, MAXLINE, fpin) == NULL) { 
err_msg("child closed pipe"); 
break; 

} 


15.6 system 函数 调用 了 wait, 终止 的 第 一 个 子 进程 是 由 popen 产生 的 。 因 为 该 子 进程 不 是 
system 创建 的 ， 所 以 它 将 再 次 调用 wait 并 一 直 阻 塞 到 sleep 完成 。 然 后 system 返 
回 。 当 pclose 调用 wait 时 ， 由 于 没有 子 进 程 可 等 待 所 以 返回 出 错 ， 导 致 pclose thik 
回 出 错 。 

15.7 尽管 具体 细节 会 随 平台 不 同 而 不 同 〈 见 图 C-19), 但 是 select 表明 描述 符 是 可 读 的 。 调 用 
read 读 完 所 有 的 数据 后 ， 返 回 0 就 表明 到 达 了 文件 尾 端 。 但 是 对 于 poll 来 说 ， 若 返回 
POLLHUP 事件 ， 则 表明 也 许 仍 有 数据 可 读 。 但 是 一 旦 读 完 了 所 有 的 数据 ，read 就 返回 0 
表明 到 达 了 文件 尾 端 。 在 读 完 了 所 有 的 数据 后 ，POLLIN 事件 就 不 会 再 返回 了 ， 即 使 需要 再 
调用 一 次 read 以 接收 文件 尾 端 通知 〈 返 回 值 为 0)。 


ae E Linux 3.2.0 | Mac OS X 10.6.8 | Solaris 10 


| 管道 写 端 关闭 时 读 端 上 的 select | select 

管道 写 端 关闭 时 读 端 上 的 poll 
管道 读 端 关闭 时 写 端 上 的 select 
管道 读 端 关 闭 时 写 端 上 的 poll 


图 C-19 select Al poll 的 管道 行为 


图 C-19 中 所 示 的 条 件 包括 R (可 读 )、W (可 写 )、E CER) HUP (HW), ERR CHÀO 
和 INV (无 效 文件 描述 符 )。 对 于 引用 已 被 读者 关闭 的 管道 的 输出 描述 符 来 说 ，select X 
明 该 描述 符 是 可 写 的 。 但 当 我 们 调用 write 时 ， 产 生 SIGPIPE 信号 。 如 果 忽 略 该 信号 或 
从 其 信号 处 理 程 序 中 返回 ，write 就 会 失败 ， 将 error RAMEPIPE. MMF poll, KR 
体 的 行为 则 会 根据 平台 的 不 同 而 不 同 。 

15.8 子 进程 向 标准 错误 写 的 内 容 同 样 也 会 在 父 进程 的 标准 错误 中 出 现 。 只 要 在 emdstring 中 包含 
shell 重 定向 2>&1， 就 可 以 将 标准 错误 发 回 给 父 进程 。 

15.9 popen 函数 fork 一 个 子 进 程 ， 子 进程 执行 shell。 然 后 shell 再 调用 fork， 最 后 由 shell 的 
子 进程 执行 命令 串 。 当 emdstring 终止 时 ，shell 恰好 在 等 待 该 事件 。 然 后 shel 退出 ， 而 这 
一 事件 又 是 pclose 中 的 waitpid 所 等 待 的 。 

15.10 解决 的 办 法 是 打开 Copen) FIFO 两 次 : 一 次 读 ; 一 次 写 。 我 们 决 不 会 使 用 为 写 而 打开 的 描 
述 符 ， 但 是 使 该 描述 符 打开 就 可 在 客户 数 从 1 变 为 0 时 ， 阻 止 产生 文件 尾 端 。 打 开 FIFO 两 
次 需要 注意 下 列 操作 方式 〈 如 非 阻 塞 open 所 要 求 的 ); 第 一 次 以 非 阻 塞 、 只 读 方式 open; 
第 二 次 以 阻塞 、 只 写 方式 open。( 如 果 先 用 非 阻 塞 、 只 写 方式 open， 将 返回 错误 。) 然后 
关闭 读 描 述 符 的 非 阻塞 属性 。 参见 图 C-20 所 示 的 代码 。 









756 附录 C 部 分 习题 答案 


#include "apue.h" 
#include <fcntl.h> 


#define FIFO "temp. fifo" 


int 
main (void) 
{ 
int fdread, fdwrite; 


unlink (FIFO); 

if (mkfifo(FIFO, FILE_MODE) < 0) 
err_sys("mkfifo error"); 

if ((fdread = open(FIFO, O_RDONLY | O_NONBLOCK)) < 0) 
err_sys("open error for reading"); 

if ((fdwrite = open(FIFO, O WRONLY)) < 0) 
err_sys("open error for writing"); 

clr fl(fdread, O NONBLOCK); 

exit(0); 


C-20 ”以 非 阻塞 方式 打开 FIFO 进行 读 、 写 操作 

15.11 随意 读 取现 行 队列 中 的 消息 会 干扰 客户 进程 -服务 器 进程 协议 ， 导 致 丢失 客户 进程 请 求 或 者 
服务 器 进程 的 响应 。 只 要 知道 队列 的 标识 符 或 者 该 队列 允许 所 有 的 用 户 读 ， 进 程 就 可 以 读 
队列 。 

15.13 由 于 服务 器 进程 和 各 客户 进程 可 能 会 将 段 连 接 到 不 同 的 地 址 ， 所 以 在 共享 存储 段 中 决 不 会 

[937] 存储 实际 物理 地 址 。 相 反 ， 当 在 共享 存储 段 中 建立 链表 时 ， 链 表 指 针 的 值 会 设置 为 共享 存 

储 段 内 另 一 对 象 的 偏 移 量 。 偏 移 量 为 所 指 对 象 的 实际 地 址 减 去 共享 存储 段 的 起 始 地 址 。 

15.14 图 C-21 显示 了 相关 的 事件 。 


父 进程 的 1 | 子 进 程 的 i | 共享 值 update 
| | 设置 成 设置 成 返回 


H mmap atete | 
子 进 程 先 运行 ， 然 后 被 阻塞 
父 进 程 运行 


然后 父 进 程 被 阻塞 
子 进程 继续 


然后 子 进程 被 阻塞 
父 进程 继续 


然后 父 进 程 被 阻塞 


然后 子 进程 被 阻塞 
父 进程 继续 


图 C-21 图 15-33 中 父 进程 和 子 进程 之 间 的 交替 过 程 
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16.1 


C-22 显示 了 一 个 打印 系统 字 节 序 的 程序 。 


#include <stdio.h> 
#include <stdlib.h> 
#include <inttypes.h> 


int 


main (void) 


{ 


16.3 


16.5 


16.6 


uint32_t i = 0x04030201; 
unsigned char *cp = (unsigned char *) &i; 


if (*cp == 1) 
printf ("little-endian\n") ; 


else if (*cp == 4) 

printf ("big-endian\n") ; 
else 

printf ("who knows?\n") ; 
exit (0); 


图 C-22 ”判断 系统 字 节 序 

对 于 我 们 将 要 监听 的 每 个 端点 ， 需 要 绑 定 到 一 个 合适 的 地 址 ， 并 对 应 每 个 描述 符 在 fd set 
结构 中 写 一 条 记录 。 然 后 使 用 select 等 待 从 多 个 端点 来 的 连接 请 求 。 回 忆 16.4 节 ， 当 一 
个 连接 请 求 达到 时 ， 一 个 被 动 的 端点 将 会 变 得 可 读 。 当 一 个 连接 请 求 真 的 到 达 时 ， 我 们 接 
受 该 请 求 ， 并 如 以 前 一 样 处 理 。 
在 main 过 程 中 ， 通 过 调用 我 们 的 signal 函数 〈 见 图 10-18) 来 捕 提 SIGCHLD， 该 函数 
将 使 用 sigaction 来 安装 处 理 程序 指定 可 重启 的 系统 调用 选项 。 下 一 步 ， 从 serve 函数 
中 删除 waitpid 调用 。 当 fork 完 子 进程 来 处 理 请 求 后 ， 父 进程 关闭 新 的 文件 描述 符 并 继 
续 监听 新 的 连接 请 求 。 最 后 ， 需 要 一 个 针对 于 SIGCHLD 的 信号 处 理 程序 ， 如 下 : 

void 

sigchld(int signo) 


{ 
while (waitpid((pid t)-1, NULL, WNOHANG) > 0) 


) 


为 了 允许 异步 套 接 字 IO， 需 要 使 用 F SETOWN fcntl 命令 建立 套 接 字 所 有 权 ， 然 后 使 用 
FIOASYNC ioctl 命令 允许 异步 信号 。 为 了 不 允许 异步 套 接 字 W/O， 只 要 简单 地 禁用 异步 
信和 号 即 可 。 我 们 混合 使 用 fcnt1 和 ioctl 命令 的 理由 是 ， 想 找到 最 可 移植 的 方法 。 代 码 
如 图 C-23 所 示 。 


#include "apue.h" 


#include <errno.h> 

#include «fcntl.h» 

#include <sys/socket.h> 

#include <sys/ioctl.h> 

#if defined(BSD) || defined(MACOS) || defined (SOLARIS) 


[939] 
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#include <sys/filio.h> 
#endif 


int 
setasync(int sockfd) 
{ 


int n; 


if (fcntl(sockfd, F SETOWN, getpid()) < 0) 
return(-1); 

n= 1; 

if (ioctl(sockfd, FIOASYNC, &n) < 0) 
return(-1); 

return(0); 


int 
clrasync(int sockfd) 
{ 


int n; 


n = 0; 

if (ioctl(sockfd, FIOASYNC, &n) < 0) 
return (-1); 

return (0); 


图 C-23 允许 与 不 允许 异步 套 接 字 IO 
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17.1 常规 管道 提供 了 一 个 字 节 流 接口 。 为 了 确定 消息 边界 ， 我 们 必须 增加 给 每 个 消息 增加 一 个 
头 部 来 指示 长 度 。 但 这 个 仍 涉 及 两 个 额外 的 复制 操作 : 一 个 是 写 入 至 管道 ， 另 一 个 是 从 管 
道 读 出 。 更 加 有 效 的 方法 是 仅 将 管道 用 于 告知 主线 程 有 一 个 新 消息 可 用 。 我 们 用 单个 字 节 
用 作 通 知 。 采 用 这 种 方法 ， 我 们 需要 移动 mymesg 结构 到 threadinfo 结构 ， 并 使 用 一 个 
互 斥 量 (mutex) 和 一 个 条 件 变量 (condition variable) 来 防止 辅助 线程 在 主线 程 完成 之 前 
重新 使 用 mymesg 结构 。 解 决 方案 如 图 C-24 所 示 。 

#include "apue.h" 

#include <poll.h> 

#include <pthread.h> 


#include <sys/msg.h> 
#include <sys/socket.h> 








#define NQ 3 /* number of queues */ 
#define MAXMSZ 512 /* maximum message size */ 
#define KEY 0x123 /* key for first message queue */ 


struct mymesg { 
long mtype; 
char mtext [MAXMSZ+1]; 
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struct threadinfo { 


int qid; 
int fa; 
int len; 
pthread_mutex_t mutex; 
pthread_cond_t ready; 
struct mymesg m; 

he 

void * 


helper(void *arg) 
{ 


int n; 
struct threadinfo *tip = arg; 
for(;;) { 


memset (&tip->m, 0, sizeof(struct mymsg) ); 
if ((n = msgrcv(tip-»qid, &tip->m, MAXMSZ, 0, 
MSG_NOERROR)) < 0) 

err_sys("msgrcv error"); 

tip->len = n; 

pthread mutex lock(&tip-»mutex); 

if (write(tip->fd, "a", sizeof(char)) < 0) 
err sys("write error"); 

pthread cond wait(&tip-»ready, &tip->mutex) ; 

pthread mutex unlock(&tip-»mutex); 


int 

main() 

( 
char È? 
int i, n, err; 
int fd[2]; 
int qid[NQ]; 
struct pollfd pfd[NQ]; 
struct threadinfo ti[NQ]; 
pthread_t tid[NQ]; 


for (i = 0; i < NQ; i++) ( 
if ((qid[i] = msgget((KEY*i), IPC CREAT|0666)) < 0) 
err sys("msgget error"); 


printf ("queue ID $d is %d\n", i, qid[i]); 


if (socketpair(AF UNIX, SOCK DGRAM, 0, fd) < 0) 
err sys("socketpair error"); 

pfd[i].fd = fd[0]; 

pfd[i].events = POLLIN; 

ti[i].gid = qid[i]; 

ti[i].fd = fd[1]; 

if (pthread cond init(&ti[i].ready, NULL) != 0) 
err sys("pthread cond init error"); 

if (pthread mutex init(&ti[i].mutex, NULL) !- 0) 
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17.4 
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err sys("pthread mutex init error"); 
if ((err = pthread create(&tid[i], NULL, helper, 
&ti[i])) != 0) 
err exit(err, "pthread create error"); 


) 


for (;;) ( 
if (poll(pfd, NQ, -1) « 0) 
err sys("poll error"); 
for (i 0; i < NQ; i++) { 
if (pfd[i].revents & POLLIN) { 
if ((n = read(pfd[i].fd, &c, sizeof(char))) < 0) 
err sys("read error"); 
ti[i].m.mtext[ti[i].len] = 0; 
printf("queue id $d, message %s\n", qid[i], 
ti[i].m.mtext); 
pthread mutex lock(&ti[i].mutex); 
pthread cond signal(&ti[i].ready); 
pthread mutex unlock(&ti[i].mutex); 


} 


exit (0); 


C-24 使 用 管道 的 XSI 消息 轮 询 
声明 指定 了 标识 符 集合 的 属性 (如 数据 类 型 )。 如 果 声 明 也 导致 分 配 了 存储 单元 ， 那 么 这 就 是 定义 。 
在 头 文件 opend.h 中 , RAIH extern 存储 类 声明 了 3 个 全 局 变量 , 这 时 并 没有 为 它们 分 
配 存储 单元 。 在 文件 main.c 中 ， 我 们 定义 了 3 个 全 局 变量 。 有 了 时， 我 们 也 会 在 定义 全 局 
变量 时 就 初始 化 它 ， 但 通常 是 使 用 C 的 默认 值 。 
select 和 poll 返回 就 绪 的 描述 符 个 数 作 为 函数 值 。 当 将 这 些 就 绪 描述 符 都 处 理 完 后 ， 操 
作 client 数组 的 循环 就 可 以 终止 。 
建议 的 解决 方案 存在 的 第 一 个 问题 是 ， 在 文件 可 能 发 生变 化 的 地 方 ， 调 用 stat 和 调用 
unlink 之 间 存 在 竞争 。 第 二 个 问题 是 , 如果 名 字 是 一 个 指向 UNIX 域 套 接 字 文件 的 符号 链 
È, WA stat 会 报告 名 字 是 一 个 套 接 字 (回想 一 下 后 面 跟 一 个 符号 链接 的 stat 函数 )， 
但 是 调用 unlink 时 ， 实 际 上 我 们 是 删除 了 这 个 符号 链接 而 不 是 套 接 字 文件 。 为 了 解决 第 
二 个 问题 ， 应 该 使 用 1stat 而 不 是 stat， 但 这 解决 不 了 第 一 个 问题 。 
第 一 种 选择 是 将 两 个 文件 描述 符 在 一 个 控制 消息 中 的 发 送 ， 每 一 个 文件 描述 符 存储 在 相 邻 
的 内 存 位 置 中 。 下 面 的 代码 展示 了 这 种 方法 : 


struct msghdr msg; 

struct cmsghdr *cmptr; 

int *ip; 

if ((cmptr = calloc(1, CMSG LEN(2*sizeof(int)))) == NULL) 
err_sys("calloc error"); 

msg.msg_control = cmptr; 

msg.msg controllen = CMSG LEN (2*sizeof (int) ); 

/* continue initializing msghdr... */ 

cmptr-»cmsg len = CMSG LEN (2*sizeof (int)); 

cmptr-»cmsg level = SOL SOCKET; 
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cmptr->cmsg type = SCM RIGHTS; 
ip = (int *)CMSG DATA(cmptr).; 
*ip++ = fdl; 

*ip = fd2; 


这 种 方法 在 本 书 中 涉及 的 4 个 平台 上 全 都 可 以 工作 。 第 二 种 选择 是 将 两 个 独立 的 cmsghar 
结构 打包 到 一 个 消息 中 。 


struct msghdr msg; 
struct cmsghdr *cmptr; 


if ((cmptr = calloc(1, 2*CMSG LEN(sizeof(int)))) == NULL) 
err_sys("calloc error"); 

msg.msg_control = cmptr; 

msg.msg controllen = 2*CMSG_LEN (sizeof (int) ); 

/* continue initializing msghdr... */ 

cmptr->cmsg_len = CMSG LEN (sizeof (int) ); 

cmptr->cmsg_level = SOL_SOCKET; 

cmptr->cmsg_type = SCM_RIGHTS; 

*(int *)CMSG DATA(cmptr) = fdl; 

cmptr = CMPTR NXTHDR(&msg, cmptr); 

cmptr-»cmsg len = CMSG LEN (sizeof (int)); 

cmptr-»cmsg level - SOL SOCKET; 

cmptr-»cmsg type - SCM RIGHTS; 

*(int *)CMSG DATA(cmptr) = fd2; 


与 第 一 种 方法 不 同 ， 这 个 方法 只 在 FreeBSD 8.0 上 能 工作 。 
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18.1 
18.2 


18.3 


注意 ， 由 于 终端 是 非 规范 模式 的 ， 所 以 必须 要 用 换行 符 而 不 是 回 车 符 终止 reset 命令 。 
它 为 128 个 字符 建 了 一 张 表 , 根据 用 户 的 要 求 设 置 最 高 位 (奇偶 校 验 位 )。 然 后 使 用 8 位 IO 
处 理 奇 偶 位 的 产生 。 

如 果 你 使 用 的 是 窗口 终端 ， 那 么 你 无 需 登录 两 次 。 在 两 个 分 开 的 窗口 之 间 ， 你 可 以 做 这 样 
的 实验 。 在 Solaris 中 ， 运 行 stty -a， 并 且 将 标准 输入 重 定向 到 运行 vi 的 终端 。 结 果 显 
示 vi 设置 MIN 为 1、TIME 为 1。read 调用 会 一 直 等 待 ， 直 到 至 少 键入 一 个 字符 ， 但 是 
该 字符 输入 后 ， 只 对 后 继 的 字符 等 待 十 分 之 一 秒 即 返 回 。 
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19.6 


telnetd 和 rlogind 两 个 服务 器 均 以 超级 用 户 权 限 运 行 ， 所 以 它们 都 可 以 成 功 地 调用 
chown 和 chmod。 

HUT pty -n stty -a 以 避免 伪 终 端 从 设备 的 termios 结构 和 winsize 结构 初始 化 。 
IRRE, fcntllf]F SETFL 命令 不 允许 改变 读 写 状态 。 

有 3 个 进程 组 : (1) 登录 shell, (2) pty 父 进程 和 子 进程 ，(3) cat 进程 。 前 两 个 进程 组 
组 成 了 一 个 会 话 ， 其 中 ， 登 录 shell 为 会 话 首 进 程 。 第 二 个 会 话 仅 包含 cat 进程 。 第 一 个 进 
TH C3 shell) 是 后 台 进 程 组 ， 其 他 两 个 进程 组 是 前 台 进 程 组 。 

首先 ， 当 cat 从 其 行规 程 模块 接收 到 文件 结束 符 时 会 终止 。 这 导致 PTY 从 设备 终止 ， 进 而 
导致 PTY 主 设备 终止 。 接 着 ， 对 于 正 从 PTY 主 设备 读 取 的 pty 父 进程 产生 一 个 文件 结束 
符 。 该 父 进程 将 SIGTERM 信号 发 送 给 子 进程 ， 于 是 子 进程 终止 。( 子 进程 不 捕 提 该 信号 。) 
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最 后 ， 父 进程 调用 main 函数 尾 端的 exit(0) 。 


图 8-29 所 示 程 序 的 相关 输出 为 : 
cat e= 270, chars = 274, stat = 0: 
pty e- 262, chars - 40, stat = 15: F X 
pty e- 288, chars - 188, stat - 0: 
19.7 这 可 通过 使 用 shell 的 echo 命令 和 date (1) 命令 实现 ， 它 们 都 在 一 个 子 shell 中 : 
#!/bin/sh 
(echo "Script started on " ‘date’; 
pty "S(SHELL:-/bin/sh)"; 
echo "Script done on " `date`) | tee typescript 


19.8 PTY 从 设备 上 的 行规 程 能 够 回 显 , 所 以 pty 从 其 标准 输入 所 读 取 的 以 及 写 向 PTY 主 设备 的 
按 默认 都 回 显 。 尽 管 程序 Cttyname) 从 不 读 取 数 据 ， 但 是 该 回 显 也 可 通过 从 设备 上 的 行 
规程 模块 实现 。 
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20. db dodelete 中 保守 的 加 锁 操 作 是 为 了 避免 和 db nextrec 发 生 竞争 条 件 。 如 果 没 有 使 用 
写 锁 保护 _qb_writedat 调用 ， 则 有 可 能 在 db_nextrec 读 某 个 记录 时 ， 该 记录 已 被 删除 : 
db nextrec 首先 读 入 一 个 索引 记录 ， 判 定 该 记录 非 空 ， 接 着 读数 据 记 录 ， 但 是 在 它 调 用 
_db_readidx fl db readdat 之 间 ， 该 记录 却 可 能 被 db dodelete 删除 了 。 

20.2 假定 db nextrec 调用 ab_readidqx， 它 将 记录 的 键 读 入 索引 缓冲 区 。 然 后 ， 该 进程 被 内 
核 调 度 进程 暂停 ， 另 一 个 进程 运行 ， 它 刚好 调用 do delete 删除 了 这 一 条 记录 ， 使 得 索引 文 
件 和 数据 记录 文件 中 对 应 部 分 都 被 清空 。 当 第 一 个 进程 恢复 执行 并 调用 db readdat (在 
db nextrec 函数 体 中 ) 时 ， 返 回 的 是 空 数据 记录 。db_nextrec 中 的 读 锁 使 得 读 入 索引 记录 
的 过 程 和 读 入 数据 记录 的 过 程 是 一 个 原子 操作 (对 于 其 他 操作 同一 数据 库 的 合作 进程 而 言 )。 

20.3 强制 性 锁 对 其 他 的 读 进程 和 写 进程 产生 了 影响 。 在 _db_writeidx 和 _db_writedat 设置 
的 锁 被 解除 之 前 ， 其 他 的 读 操作 和 写 操作 都 将 被 阻塞 。 

20.5 在 写 索 引 记录 之 前 写 数据 记录 ， 通 过 这 一 方法 来 防止 如 下 情形 : 若 该 进程 在 两 次 写 之 间 被 
杀 死 从 而 产生 不 正常 的 记录 。 如 果 进 程 先 写 索引 记录 ， 而 在 写 数 据 记 录 之 前 被 杀 死 ， 那 么 
就 会 得 到 一 个 有 效 的 索引 记录 ， 但 它 却 指向 一 个 无 效 的 数据 记录 。 
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21.5 这 里 有 一 些 提示 。 有 两 个 地 方 可 以 检查 队列 中 的 作业 : 打印 守护 进程 的 队列 和 网 络 打 印 机 
的 内 部 队列 。 注 意 ， 不 要 让 一 个 用 户 可 以 取消 其 他 用 户 的 打印 作业 。 当 然 ， 超 级 用 户 可 以 
取消 任何 作业 。 

21.7 不 需要 唤醒 守护 进程 ， 因 为 知道 需要 打印 一 个 文件 时 才 需 要 重读 配置 文件 。printer_thread 
函数 在 每 次 向 打印 机 发 送 作业 之 前 检查 是 否 需 要 重读 配置 文件 。 

21.9 需要 使 用 null 字 节 来 终止 写 到 作业 文件 的 字符 串 (strlen 在 计算 字符 串 长 度 时 不 包含 终止 
null 字 节 )。 有 两 种 简单 的 方法 : 要 么 对 写 入 的 字 节 数 加 1， 要 么 使 用 dprintf 函数 而 不 是 
调用 sprintf 和 write。 
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这 本 书 为 七 卷 本 ， 包 括 下 列 各 部 分 内 容 : 命令 和 公用 程序 (第 1 卷 ) 系统 界面 和 头 文件 (第 
23) HEEL (BIA), 程序 设计 语言 (第 4 卷 )、 MHF (ASK) 窗口 管理 (第 6 卷 ) 
以 及 网 络 服务 (第 7 卷 )。 
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标 有 “definition of 的 函数 子 项 指向 函数 原型 出 现 的 地 方 ， 当 该 函数 可 用 时 ， 指 向 函数 的 源 代 
码 。 文 中 定义 的 用 于 后 续 例 子 中 的 函数 也 包含 在 索引 中 ， 例 如 图 3~11 中 的 set_fl 函数 。 较 大 
例子 (第 17、19、20 和 21 章 ) 中 的 某 些 部 分 是 外 部 函数 的 定义 ， 为 了 便于 理解 这 些 大 例子 ， 这 
些 外 部 函数 的 定义 也 包含 在 本 索引 中 。 另 外 ， 本 索引 还 包括 许多 例子 中 出 现 的 重要 函数 和 常量 ， 
如 select Ml poll. 不 过 几乎 每 个 例子 中 都 会 出 现 的 一 般 函 数 (如 exit) 出 现在 例子 中 时 并 没 
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EEXIST 错误 , 121, 558, 584 
EFBIG 错误 , 925 
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ENOLCK 错误 , 16 
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EPIPE 错误 , 537, 937 
Epoch (特定 时间 , 指 1970 4E 1 A 1 H 00:00:00) , 20, 22, 
126, 187, 189-190, 640 
ERANGE 错误 , 50 
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ETIME 错误 , 800, 805 
ETIMEDOUT 错误 , 407, 413, 415, 581, 800 
Evans, J., 949 
EWOULDBLOCK 错误 , 16, 482, 609, 627 
exec MA, 10~11, 13, 23, 39-40, 43, 79, 82, 100, 121, 125, 
197, 201, 203, 225, 229, 233—234, 249-257, 260-261, 
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函数 定义 , 440 
pthread condattr getclock 函数 , 441 
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函数 定义 , 407 
pthread mutex trylock 函数 , 400, 402 
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函数 定义 , 356 
SIGLOST 信号 ,317 
SIGLWP 信号 , 317, 319, 321 
signal 函数 , 18~19, 59, 308, 323~326, 329~335, 339~343, 
348~349, 354—356, 360—361, 363, 368, 378, 510, 550, 
709, 711, 939 
函数 定义 ,323, 354 
signal mask (信号 屏蔽 字 ) , 336 
signal set (信和 号 集 ) , 336, 344~345, 532, 933 
<signal.h> 头 文件 , 27, 240, 314, 324, 344—345, 380 
signal intr 函数 , 330, 355, 364, 382, 508, 733, 896, 930 
函数 定义 , 355 
signals (信和 号) , 18~19, 313-382 
blocking〈 信 号 阻塞 ) , 335 
delivery〈 信 号 递送 ) , 335 
generation (信号 产生 ) , 335 
generation, pseudo terminal 〈 伪 终端 信号 产生 ) ,741 
job-control〈 作 业 控 制 信 号 ) ,377-379 
null (null fa) ,314, 337 
pending 〈 未 决 信号 ) ,335 
queueing (fa SHEBA) , 336, 349, 376 
reliable〈 可 靠 信号 ) , 335~336 
unreliable (不 可 靠 信号 ) ,326~327 
signal thread 函数 , 814, 830 
函数 定义 , 830 
sigpause AR, 331 
sigpending 函数 , 331, 335, 347-349 
函数 定义 , 347 
SIGPIPE 信号 , 314, 317, 319, 537, 550~551, 553, 556, 587, 
611, 815, 936 
SIGPOLL 信号 , 317, 319, 501, 509~510 
sigprocmask PA, 331, 336, 340, 344, 346-349, 360, 
362—364, 366, 370, 374, 378, 453-454, 456, 701 
函数 定义 , 346 
SIGPROF 信号 ,317. 320 
SIGPWR 信号 ,317~318, 320 
sigqueue 函数 , 222, 331, 353, 376-377 
函数 定义 ,376 
SIGQUEUE_MAX 常量 , 40, 43, 376 





SIGQUIT 信和 号 , 300, 317, 320, 347-349, 361~362, 367, 370, 
372, 456-457, 546, 681, 689, 702, 709 
SIGRTMAX 常量 , 376 
SIGRTMIN 常量 , 376 
SIGSEGV 信号 , 314, 317, 320, 332, 336, 352-353, 393, 527 
sigset MX, 331, 333 
sigsetjmp 函数 ,219, 331, 355-358 
函数 定义 , 356 
SIG SETMASK 常量 , 346, 348-349, 360, 362~364, 366, 370, 
374, 454, 456, 701 
sigset t 数据 类 型 , 59, 336, 344, 347-348, 360-361, 363, 
366, 369, 374, 378, 454-456, 701, 813 
SIGSTKFLT 信号 , 317, 320 
SIGSTOP 信号 , 315, 317, 320, 323, 346, 377 
SIGSUSP 信号 , 689 
sigsuspend 函数 ,331, 340, 359~365, 374, 451 
函数 定义 , 359 
SIGSYS 信号 , 317, 320 
SIGTERM 信号, 315, 317, 321, 325, 476-479, 709, 732~733, 
742, 815, 830, 944 
SIGTHAW 信号 , 317, 321 
SIGTHR 信和 号 ,319 
sigtimedwait 函数 ,451 
SIGTRAP 信号 , 317, 321, 351, 353 
SIGTSTP fri &, 300, 308, 317, 320-321, 377~379, 680, 682, 
701, 735 
SIGTTIN 信号 , 300-301, 304, 309, 317, 321, 377, 379 
SIGTTOU 信号 , 301-302, 317, 321, 377, 379, 691 
SIG UNBLOCK 常量 , 346, 349, 378, 454 
SIGURG 信号 , 83, 314, 317, 319, 322, 510-511, 626 
SIGUSR1 fi 59, 317, 322, 324, 347, 356-358, 360-361, 
363-364, 501 
SIGUSR2 fri 5, 317, 322, 324, 363-364 
sigval 结构 ,352 
SIGVTALRM 信号, 317, 322 
sigwait 函数 , 451, 454~455, 457, 475, 477, 830 
函数 定义 , 454 
sigwaitinfo AX, 451 
SIGWAITING 信和 号 ,317, 322 
SIGWINCH f $, 311, 317, 322, 710~712, 718~719, 
741~742 
SIGXCPU 信号 , 221, 317, 322 
SIGXFSZ 信号 , 221, 317, 322, 382, 925 
SIGXRES 信号 ,317, 322 
Silicon Graphics, Inc., Ji, SGI 
SI MESGQ 常量 , 353 
Singh, A., 112, 116, 952 
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Single UNIX Specification, 见 SUS 
Version 3， 见 SUSv3 
Version 4， 见 SUSv4 
single-instance daemons 〈 单 实例 守护 进程 ) , 473-474 
S_INPUT 常量 , 510 
SIOCSPGRP 常量 , 627 
SI_QUEUE 常量 , 353 
S_IRGRP 常量 , 99, 104, 107, 140, 149, 473, 896 
S_IROTH 常量 , 99, 104, 107, 140, 149, 473, 896 
S_IRUSR 常量 , 99, 104, 107, 140, 149, 169, 473, 818, 896 
S_IRWXG 常量 , 107, 639 
S_IRWXO 常量 , 107, 639 
S_IRWXU 常量 , 107, 584, 639 
S_ISBLK 函数 , 96~97, 139 
S_ISCHR 函数 , 96~97, 139, 698 
S_ISDIR 函数 , 96~97, 133, 698 
S_ISFIFO 函数 , 96~97, 535, 552 
S_ISGID 常量 , 99, 107, 140, 498 
S_ISLNK 函数 , 96~97 
S_ISREG 函数 , 96, 808 
S_ISSOCK 函数 , 96~97, 639 
S_ISUID 常量 , 99, 107, 140 
S_ISVTX 常量 , 107~109, 140 
SI_TIMER 常量 , 353 
SI_USER 常量 , 353 
S_IWGRP 常量 , 99, 104, 107, 140, 149 
S_IWOTH 常量 , 99, 104, 107, 140, 149 
S IWUSR 常量 , 99, 104, 107, 140, 149, 169, 473, 818, 896 
S_IXGRP 常量 , 99, 107, 140, 498, 896 
S IXOTH 常量 , 99, 107, 140, 896 
S_IXUSR 常量 , 99, 107, 140, 169, 896 
size, file 〈 文 件 大 小 ) , 111-112 
size 程序 , 206~207, 226 
sizeof 操作 符 , 231 
size t 数据 类 型 , 59~60, 71, 507, 772, 906 
. SLBF 常量 , 166 
sleep MA, 230, 234, 243, 246, 272, 274, 308, 331, 334, 
339-342, 348, 372-375, 381-382, 387, 391-392, 439, 
451, 460, 504, 532, 606—607, 923, 925, 928, 931, 936 
函数 定义 ,373-~374, 929 
sleep 程序 , 372 
sleep2 函数 , 924 
sleep_us 函数 , 532, 896 
函数 定义 , 933~934 
SMF (Service Management Facility， 服 务 管理 设施 ) , 293 
S_MSG 常量 , 510 
. SNBF 常量 , 165 
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snprintf 函数 ,159, 901, 904 
函数 定义 , 159 
Snyder, G., 951 
sockaddr 结构 ,595~597, 605~607, 609, 622, 625, 635, 
637, 639, 641, 800 
sockaddr_in 结构 , 595~596, 603 
sockaddr in6 结构 , 595—596 
sockaddr un 结构 , 634~638, 640—642 
sockatmark 函数 ,331, 626 
函数 定义 , 626 
SOCK_DGRAM 常量 , 590~591, 602, 608, 612, 621, 623, 632, 
941 
socket 
addressing (FFH) , 593-605 
descriptors ( 套 接 字 描 述 符 ) , 590-593 
I/O, asynchronous 〈 异 步 套 接 字 VO) , 627 
I/O, nonblocking 〈 非 阻塞 套 接 字 1/0) , 608-609, 627 
mechanism 〔 套 接 字 机 制 ) , 95, 534, 587, 589-628 
options 〈 套 接 字 选项 ) , 623~625 
socket 函数 ，148，331，590，592，607，609，621，625， 
637~638, 640~641, 808 
函数 定义 , 590 
socketpair PAM, 148, 331, 629~630, 632, 634, 941 
函数 定义 , 630 
sockets, UNIX domain (UNIX 域 套 接 字 ) , 629~642 
timing 〈 套 接 字 时 间 ) , 565 
socklen t 数据 类 型 , 606-607, 609, 622, 625, 800 
SOCK_RAW 常量 , 590~591, 602 
SOCK_SEQPACKET 常量 , 590~591, 602, 605, 609, 612, 625 
SOCK STREAM 常量 , 319, 590-591, 602, 605, 609, 612, 
614—616, 618-619, 625, 630, 635, 637, 640, 802, 808, 
816 
Solaris , 3-4, 26-27, 29-30, 35-36, 38, 41, 48-49, 57-60, 62, 
64-65, 70, 76, 88, 102, 108-113, 121-122, 129, 
131-132, 138, 178, 182, 184-188, 208-209, 211-212, 
222, 225, 229, 240, 242, 244—245, 260, 277, 288, 290, 
293, 296, 298, 303, 314, 316-323, 329, 334-335, 351, 
355, 371, 373, 377, 379—380, 385, 388, 392, 396, 409, 
426-427, 432, 439, 471, 485, 496-497, 499, 503, 
530—531, 534, 559, 561, 563, 565, 567, 572-573, 576, 
592, 594, 607—608, 611—613, 627, 634, 648, 675-678, 
684—691, 693, 700, 704, 716—717, 723-724, 726-721, 
740—741, 744, 799, 911, 918, 925, 930, 932, 935-936, 
951 
SOL SOCKET 常量 , 624—625, 645—646, 650—652 
solutions to exercises (习题 解答 ) , 905-945 
SOMAXCONN 常量 , 608 





SO OOBINLINE 常量 , 626 
SO_PASSCRED 常量 , 651 
SO_REUSEADDR 常量 , 625 
S_OUTPUT 常量 , 510 
Spafford, G., 181, 250, 298, 949 
spawn 函数 , 234 
<spawn.h> 头 文件 , 30 
spin locks〈 自 旋 锁 ) ,417~418 
spooling, printer (打印 机 假 脱 机 ) , 793~795 
sprintf PR, 159, 549, 616, 622, 640, 655, 657, 659, 
668~669, 759, 772~773, 803, 818~819, 822~823, 
825~827, 833~835, 837, 845, 945 
函数 定义 , 159 
spwd 结构 , 918 
squid login name (squid 登录 名 ) ,178 
S RDBAND 常量 , 510 
S_RDNORM 常量 , 510 
sscanf PAX, 162, 549, 551, 802~803 
函数 定义 , 162 
ssh 程序 , 293 
sshd 程序 , 465 
SSIZE_MAX 常量 , 38, 41, 71 
ssize t 数据 类 型 , 39, 59, 71 
stack (f£) ,205,215 
stackaddr 属性 , 427 
stacksize 属性 , 427 
standard error〔 标 准 错误 ) , 8, 145, 617 
standard error routines (标准 错误 例 程 ), 898-904 
standard input 〈 标 准 输入 ) , 8, 145 
standard 1/0 
alternatives〈 标 准 IO 替代 方案 ) , 174~175 
buffering 〈 带 缓冲 的 标准 1/0) , 145-147, 231, 235, 265, 
367, 552, 721, 752 
efficiency (标准 IO 效率 ) , 153-156 
implementation (PRYE IO 实现 ) , 164~167 
library (标准 I/O FE) , 10, 143-175 
streams (RYE L/O 流 ) , 143-144 
versus unbuffered I/O, timing (标准 IO 与 不 带 缓冲 的 IO 
的 时 间 比 较 ) , 155 
standard output 〈 标 准 输出 ) , 8, 145, 617 
standards (RE) ,25~33 
differences 〔〈 标 准 差异 ) , 58-59 
START terminal character (START 终端 字符 ) , 678, 
680~682, 686, 689, 693 
stat PR, 4, 7, 65, 93~95, 97, 99, 107, 121-122, 124, 
126-128, 131, 138, 140-141, 170, 331, 452, 586, 592, 
628, 639—640, 670, 698, 908, 910, 942 





函数 定义 , 93 
stat 结构 , 93-96, 98, 111, 114, 124, 140, 147, 167, 170, 
498, 518, 529, 535, 552, 557, 586, 638, 697—698, 757, 
807, 832 
static variables (静态 变量 ) ,219 
STATUS terminal character (STATUS 终止 符 ) , 678, 682, 
687, 689, 703 
«stdarg.h»3k Xf, 27, 162-163, 755, 758 
<stdbool .h> 头 文件 , 27 
__STDC_TEC 559 常量 ,31 
<stddef.h> 头 文件 , 27, 635 
stderr 变量 , 145, 483, 731, 901 
STDERR FILENO 常量 , 62, 145, 618~619, 643, 648, 
652, 729 
stdin 变量 , 10, 145, 154, 214, 216, 550—551, 654 
STDIN FILENO 常量 , 9, 62, 67, 72, 145, 308, 378, 483, 539, 
544, 549~550, 619, 655~656, 679, 684, 709, 711, 728, 
730~732, 739~740 
<stdint.h> 头 文件 , 27, 595 
<stdio.h> 头 文件 , 10, 27, 38, 51, 145, 147, 151, 164, 168, 
694, 755, 895 
«stdlib.h»3k Xf, 27, 208, 895 
stdout 变量 , 10, 145, 154, 247-248, 275, 901, 921, 930 
STDOUT FILENO 常量 , 9, 62, 72, 145, 230, 235, 378, 483, 
537, 544, 549—550, 614, 618-620, 654—656, 729, 733, 
739—740, 921 
Stevens, W. R., 157, 291, 470, 505, 589, 717, 793, 952 
sticky bit 〈 粘 着 位 ) , 107-109, 117, 140 
stime 函数 , 190 
Stonebraker, M. R., 743, 953 
STOP terminal character (STOP 终端 字符 ) , 678, 680—682, 
686, 689, 693 
str2sig 函数 , 380 
函数 定义 ,380 
strace 程序 , 497 
Strang, J., 712, 953 
strchr PAM, 767 
stream orientation 〈 流 方向 ) , 144 
STREAM_MAX 常量 , 38, 40, 43, 49 
STREAMS , 88, 143, 501—502, 506, 508, 510, 534, 560, 565, 
648, 716~717, 722, 726, 740 
streams, memory (AFL) , 171~174 
STREAMS module 
ldterm, 716, 726 
pckt, 716, 740 
ptem, 716, 726 
ttcompat, 716, 726 
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streams, standard I/O (RYE VO 流 ) , 143-144 
STREAMS-based pipes, mounted (装配 的 基于 STREAMS 
的 管道 ) , 534 
timing (计时 ) , 565 
strerror Pi, 15-16, 24, 380, 442, 452, 471, 474, 
478~479, 600, 615~618, 621~622, 657, 669, 823~827, 
830, 833~834, 842, 899, 901, 904, 906, 931 
函数 定义 , 15 
strerror r 函数 , 443,452 
strftime 函数 , 190, 192—196, 264, 408, 452, 919 
函数 定义 , 192 
strftimel AR, 192 
函数 定义 , 192 
<string.h> 头 文件 , 27, 895 
«strings.h»3k X ffr, 29 
strip 程序 , 920 
strlen 函数 , 12, 231, 945 
strncasecmp 函数 , 840 
strncpy 函数 , 809 
Strong, H. R., 744, 750, 949 
<stropts.h> 头 文件 , 508, 510 
strptime 函数 , 195 
函数 定义 , 195 
strsignal 函数 , 380, 830 
函数 定义 , 380 
strtok 函数 , 442, 657~658 
strtok_r 函数 , 443 
strtol 函数 , 633 
stty 程序 , 301, 691~692, 702, 713, 943 
Stumm, M., 174, 531, 950 
S TYPEISMQ 函数 , 96 
S_TYPEISSEM 函数 , 96 
S TYPEISSHM 函数 , 96 
su 程序 , 472 
submit file 函数 ,807, 809, 811 
函数 定义 , 809 
SUID, Jil, set-user-ID 
Sun Microsystems, 33, 35, 76, 740, 953 
SunOS, 33, 206, 330, 354 
superuser (HARA) , 16 
supplementary group ID (附属 组 ID ) , 18, 39, 98, 101, 108, 
110, 183~184, 233, 252, 258 
SUS (Single UNIX Specification) , 28, 30~33, 36, 50, 53-54, 
57~58, 60~61, 64, 69, 78, 88, 94, 105, 107, 109, 131, 
136, 143, 157, 163, 168~169, 180, 183, 190~191, 196, 
211-212, 220-221, 234, 239, 244—245, 262, 293, 296, 
311, 315, 322, 330, 333, 352, 354, 410, 425, 429~431, 
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442, 469~472, 485, 496, 501, 507, 509, 521, 527~528, 
533—534, 559, 561, 565~566, 572~573, 583, 596, 607, 
610, 612, 623, 627, 645, 662, 674, 678, 683, 722~724, 
744, 910, 950, 953 
SUSP terminal character (SUSP 终端 字符 ) , 678, 680, 682, 
688, 701 
SUSv3 (Single UNIX Specification, Version 3) , 32 
SUSv4 (Single UNIX Specification, Version 4), 32, 88, 132, 
143, 153, 168~169, 189, 314, 319~320, 336, 375~376, 
384, 442, 501, 509—510, 525, 533, 571, 579 
SVID (System V Interface Definition) , 32-33, 948 
SVR2 , 65, 187, 317, 329, 336, 340—341, 712, 948 
SVR3 , 76, 129, 201, 299, 313, 317, 319, 326, 329, 333, 336, 
496, 502, 507, 898, 948 
SVR3.2, 36, 81, 267 
SVR4 , 3, 21, 33, 35-36, 48, 63, 65, 76, 121, 187, 209, 290, 
296, 299, 310, 313, 317, 329, 333, 336, 469, 502, 
507—508, 521, 712, 722, 744, 948, 953 
swapper process〈 交 换 进 程 ), 227 
S_WRBAND 常量 , 510 
S_WRNORM 常量 , 510 
symbolic link 〔〈 符 号 链接 ) , 55, 94-95, 110-111, 114, 118, 
120~123, 131, 137, 141, 186, 908~909 
symlink 函数 , 123~124, 331, 452 
函数 定义 , 123 
symlinkat 函数 , 123~124, 331, 452 
函数 定义 , 123 
SYMLINK MAX 常量 , 39, 44, 49 
SYMLOOP_MAX 常量 , 40, 43, 48~49 
sync PAM, 61, 81, 452 
函数 定义 , 81 
sync 程序 , 81 
synchronization mechanisms 〈 同 步 机 制 ) , 86-87 
synchronous write (同步 写 ) , 63, 86-87 
<sys/acct.h> 头 文件 , 269 
sysconf 函数 , 20, 37, 39, 41-48, 50~54, 57, 59~60, 69, 98, 
201, 221, 256, 276, 280—281, 384, 425-426, 429, 431, 
442, 516, 527, 616, 618, 623, 800, 815, 907 
函数 定义 , 42 
sysctl 程序 , 315, 559 
sysdef 程序 , 559 
<sys/disklabel.h> 头 文件 , 88 
<sys/filio.h> 头 文件 , 88 
<sys/ipc.h> 头 文件 , 30, 558 
<sys/iso/signal_iso.h> 头 文件 ,314 
syslog Pi, 452, 465, 468-476, 478-480, 615~619, 
622—623, 901, 904, 928 


函数 定义 , 470 
syslogd 程序 , 470~471, 473, 475, 479~480 
<syslog .h> 头 文件 , 30 
<sys/mkdev.h> 头 文件 , 138 
<sys/mman .h> 头 文件 , 29 
<sys/msg.h> 头 文件 , 30 
<sys/mtio.h> 头 文件 , 88 
<sys/param.h> 头 文件 , 49, 51 
<sys/resource.h> 头 文件 ,30 
«sys/select.h»3k X ff, 29, 501, 504, 932-933 
<sys/sem.h>k X ff, 30, 568 
«sys/shm.h»3k X ff, 30 
sys siglist 变量 ,379 
«sys/signal.h»3k Xf, 314 
<sys/socket .h> 头 文件 , 29, 608 
<sys/sockio.h> 头 文件 , 88 
<sys/stat.h> 头 文件 , 29, 97 
<sys/statvfs.h> 头 文件 , 29 
<sys/sysmacros .h> 头 文件 , 138 
system calls (系统 调用 ) , 1,21 

interrupted( 中 断 系 统 调 用 ), 327~330, 343, 351, 354~355, 

365, 508 
restarted (重启 系统 调用 ) , 329-330, 342-343, 351, 354, 
508, 700 

tracing (跟踪 系统 调用 ) , 497 

versus functions (系统 调用 与 函数 ) ,21~23 
system PAR, 23, 129, 227, 249, 264~269, 281-283, 349, 

367—372, 381, 451, 538, 542, 923, 936 

函数 定义 , 265-266, 369 
return value (system 函数 返回 值 ) ,371 
system identification (系统 标识 ) , 187-189 
system process (系统 进程 ) , 228, 337 
System V, 87, 464, 466, 469, 475, 482, 485, 500~501, 506, 

509~510, 722, 726 

System V Interface Definition, 见 SVID 
<sys/time .h> 头 文件 ,30, 501 
<sys/time .h> 头 文件 , 29 
<sys/ttycom.h> 头 文件 , 88 
<sys/types .h> 头 文件 , 29, 58, 138, 501, 557, 933 
<sys/uio.h> 头 文件 ,30 
<sys/un .h> 头 文件 ,29, 634 
«sys/utsname.h»3k X fft, 29 
«sys/wait.h»3k X ff, 29, 239 
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TABO 常量 , 691 
TAB1 常量 , 691 
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TAB2 常量 , 691 
TAB3 常量 , 690~691 
TABDLY 常量 , 676, 684, 689~691 
tar 程序 , 127, 135, 142, 910~911 
<tar.h> 头 文件 , 29 
tcdrain 函数 ,322, 331, 451, 677, 693 
函数 定义 , 693 
tcflag t 数据 类 型 , 674 
tcflow 函数 , 322, 331, 677, 693 
函数 定义 , 693 
tcflush 函数 , 145, 322, 331, 673, 677, 693 
函数 定义 , 693 
tcgetattr MM, 331, 674, 677, 679, 683~684, 691—692, 
695, 701, 705—707, 722, 730—731 
函数 定义 , 683 
tcgetpgrp 函数 , 298-299, 331, 674, 677 
函数 定义 , 298 
tcgetsid 函数 , 2908-299, 674, 677 
函数 定义 , 299 
TCIFLUSH 常量 , 653 
TCIOFF 常量 , 693 
TCIOFLUSH 常量 , 693 
TCION 常量 , 693 
TCMalloc, 210, 949 
TCOFLUSH 常量 , 693 
TCOOFF 常量 , 693 
TCOON 常量 , 693 
TCSADRAIN 常量 , 683 
TCSAFLUSH 常量 , 679, 683, 701, 705~707 
TCSANOW 常量 , 683~684, 728, 731 
tcsendbreak PAM, 322, 331, 677, 682, 693~694 
函数 定义 , 693 
tcsetattr MAM, 322, 331, 673~674, 677, 679, 683~684, 
691~692, 701, 705~707, 722, 728, 731, 738 
函数 定义 , 683 
tcsetpgrp 函数 , 298~299, 301, 303, 322, 331, 674, 677 
函数 定义 , 298 
tee 程序 , 554~555 
tell 函数 , 67 
TELL_CHILD 函数 , 247~248, 362, 491, 498, 532, 539, 541, 
577, 898 
函数 定义 , 363, 540 
telldir 函数 , 130~135 
函数 定义 , 130 
TELL PARENT 函数 , 247, 362, 491, 532, 539, 541, 577, 
898, 934 
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